圖片來源: 

Google

日前發表全新的多模態大型語言模型Gemini之後,Google周三(12/13)針對開發者與企業推出了Gemini Pro,前者可透過Google AI Studio中的Gemini API使用,後者則可藉由Google Cloud的Vertex AI平臺存取。

定位於多模態LLM的Gemini支援文字、圖像及聲音的輸入,Google將其分為3種版本,分別是最強大的Gemini Ultra,最通用的Gemini Pro,以及可於行動裝置上運作的Gemini Nano。目前Google已將Gemini Nano應用於Google Pixel 8上,也於Google Bard聊天機器人中整合了Gemini Pro,現在則進一步開放開發者及企業使用Gemini Pro。

此版Gemini Pro支援32K的文字脈絡長度,具備函式呼叫、嵌入、語義檢索、客製化知識基礎及聊天功能,提供各種SDK,也支援Python、Android(Kotlin)、Node.js、Swift及JavaScript等程式語言。基本的Gemini Pro僅接受文字輸入與輸出,另有一個Gemini Pro Vision多模態終端則可接受文字及圖像輸入,但僅會輸出文字。

Google AI Studio為一免費的網頁開發者工具,可用來開發提示,進而取得可用於程式開發的API金鑰。

Gemini Pro現已可於全球逾180個國家使用,支援38種語言,開發者以Google帳戶登入Google AI Studio即可免費試用,其免費額度為每分鐘輸入60個請求,當需要托管環境時,也可輕易將成果遷移至Vertex AI,預計於明年初推出付費服務,屆時每輸入1,000個字元的費用是0.00025美元,每輸入一個圖像的費用則是0.0025美元,每1,000個字元的輸出費用則是0.0005美元。企業用戶亦可透過已整合了Gemini Pro的Vertex AI平臺來試用該服務。

值得注意的是,當開發者使用Gemini Pro的免費額度時,其API與Google AI Studio的輸入與輸出可能會被審核人員存取,目的是為了改善服務品質,但相關資料會移除可用來辨識身分的資訊。

熱門新聞

Advertisement