| 蘋果 | MGIE | 多模態大型語言模型 | MLLM | 圖片生成

蘋果開源圖片編修AI模型MGIE

蘋果釋出多模態AI模型MGIE,能將人類提示文字轉換成更明確的圖片編輯指令,可以更精確完成修圖或改良圖片

2024-02-08

| 蘋果 | 多模態大型語言模型 | MLLM | Ferret

蘋果公布多模態AI模型Ferret

蘋果發表多模態大型語言模型Ferret,能接受文字、聲音、影像或數據的輸入,蘋果的研究論文顯示Ferret效能優於Kosmos-2、GPT4-ROI、LLaVA、Shikra等多模態大語言模型

2023-12-25

| 多模態大型語言模型 | Gemini | Gemini Pro | google

Google開放開發者及企業測試Gemini Pro

Google針對開發者與企業推出Gemini Pro,支援32K的文字脈絡長度,具備函式呼叫、嵌入、語義檢索、客製化知識基礎及聊天功能

2023-12-14