圖片來源: 

Google

Google繼上周公布大型語言模型(large language model,LLM)Gemini 1.5版後,本周再公布開源AI模型Gemma 2個版本,讓開發及研究人員在雲端、資料中心甚至筆電上自建與執行AI模型。

Gemma是一輕量開源模型家族,由Google DeepMind及Google其他團隊開發,它是以開發Gemini模型相同的研究和技術為基礎打造而成。Gemma名稱源自拉丁語「gemma」,意思是「寶石」。開源的Gemma有二個版本,名為Gemma 2B及7B,Google並釋出其他協助開發、協同及負責任使用的工具。Gemma今日已在全球上線(ai.google.dev/gemma)。

除了Gemma開源模型,Google最新AI模型Gemini也在今日全面上線。

Google強調,Gemma和Gemini採用相同技術與基礎架構元件,這使得Gemma 2B及7B效能超越其他同樣規模的開源模型。Gemma在數項標竿測試上,也超越更大的模型。根據Google提供的數據,不論在推論、數學、撰寫程式上,Gemma 7B都超越Llama 2 7B,而在多項數據上,也超越開源模型Mistral 7B。

圖片來源_Google

Gemma預訓練模型及依指示微調(instruction-tuned)後的模型,可直接執行於開發人員的筆電或工作站、桌機、或者Google Cloud的Vertex AI和Google Kubernetes Engine(GKE)上。VertexAI上有廣泛MLOps工具,內建多種微調選項及一鍵部署。Google表示,不論是代管的Vertex AI工具或自行管理的GKE,都支援客製化,包括能部署到各種GPU、TPU、和CPU等基礎架構平臺上。

Gemma支援多種工具和系統,允許開發人員和企業以自有資料微調Gemma。Google提供的推論和監督式微調參考實作工具支援多種主要框架,包括Kera 3.0、原生PyTorch、JAX和Hugging Face Transformers。

在硬體方面,Gemma已針對多種AI硬體平臺進行過優化,除了Google Cloud TPU外,Google也和Nvidia合作,以便確保Nvidia GPU為基礎的雲端、本地部署資料中心、到RTX AI PC上具備高執行效能。

Google強調Gemma是根據其安全與負責任的AI原則設計。為了確保Gemma預訓練模型的安全與穩定,研發團隊使用自動化方法篩選掉資料集中的個資及其他敏感資訊,也使用微調及基於人類反饋的強化式學習(reinforcement learning from human feedback,RLHF)確保模型符合負責任行為。同時為了解及降低Gemma模型的風險,Google也實行嚴謹的評估,包括紅隊演練、自動化威脅測試及模型的危險活動能力評估。為讓外部用戶進行負責任AI的評估,Google昨日也公布新的負責任生成式AI工具包,包括可以簡單範例建立安全分類器的工具、模型除錯及Google分享的負責任模型開發與部署指引。

為方便開發人員開始使用Gemma,Gemma可整合Kaggle、Colab notebook常見工具如Hugging Face、MaxText、Nvidia MeMo及TensorRT-LLM。為吸引開發人員使用Gemma,Google提供Kaggle notebook、Colab免費方案,以及300美元Google Cloud點數。Google甚至提供高達50萬美元等值Google Cloud點數,供研究人員申請執行專案。

熱門新聞

Advertisement