
奈米香蕉模型爆紅,上線十天生成超過2億張圖片,亞太地區最夯,「公仔提示」是排名第一的模型生成提示。
奈米香蕉模型大爆紅,Google公布這款新模型的最新使用數據,上線十天,已經生成超過2億張圖片,尤其是亞太地區參與度最積極,甚至領導了全世界的用法。臺灣爆紅的「公仔提示」,正是奈米香蕉(Nano Banana)模型生成圖片的第一名提示。
Google早在3月時,就發表了第一款圖片編輯模型Gemini 2.0 Flash,可以透過多輪的對話,來修改圖片的內容,這款模型大受好評,但是用戶希望有更好的圖片編輯能力,特別想保留自己的模樣。
上週二(8/26),Google推出了新款的圖片編輯模型Gemini 2.5 Flash Image,也就是大家熱烈討論的Nano Banana模型,負責Gemini應用多模態生成技術的Google產品經理David Sharon表示:「這款模型最大的突破點是,可以保留原圖的相似性和臉部特徵,讓使用者可以用全新的方式想像自己。」
新款模型大受好評,上線才十天,全球爆量生成了超過2億張圖片,Gemini應用程式也多了1千萬名新用戶。Google特別對亞太區用戶的參與程度感到驚訝,特別是泰國、印尼和菲律賓。菲律賓生成超過2千5百萬張圖片,印尼2千萬張,泰國也多達1850萬張之多。David Sharon強調:「亞太地區領導了全世界怎麼使用這款新模型。」
像是,有人會生成自己在不同年齡的模樣,或是自己身處在不同年代,60、70、80年代,或是在知名電影場景中的模樣。在泰國、印尼和菲律賓最瘋傳的就是「公仔提示」,把自己變成一個3D公仔和包裝盒,這是目前第一名的提示指令。
Nano Banana模型背後包括了兩套模型,一款是專門生成圖片的擴散模型(Diffusion Model),也就是可以產生高度擬真圖片的Imagen 4,另一套則是Gemini模型,像是Gemini Flash 2.5或Pro 2.5,透過Gemini模型的邏輯、推理、程式開發和世界知識,來教導擴散模型如何生成圖片。這款模型也是一個多工模型,可以用來做不同的任務。
目前的奈米香蕉模型版本,還沒釋出Google計畫提供的最佳解析度版本,David Sharon透露,模型端和用戶端還有一些問題需要處理,預計下周的模型更新,就可以提供比現在更高解析度的圖片,也開放下載,至於4K解析度等更好畫質的版本,則還沒有釋出的計畫。
每一張從Google模型生成的圖片,都會隱藏了SynthID的隱形數位浮水印,可以用來判斷一張圖是否是Googel的AI所生成。凡是透過Google任何服務,進行任何處理的AI圖片,都會保留原始的浮水印。Google正在開發一款消費端工具,可以讓一般用上傳圖片來檢查。
為了避免圖片生成工具遭到濫用,Google內部進行了大量紅隊測試、評估和政策討論,也提供許多防護柵欄和安全過濾器,SynthID數位浮水印也是其中一項因應機制。
Google透露,未來半年的首頁目標是服務使用者,因為用戶成長速度非常驚人,我們正全力跟上這個需求,並根據用戶回饋的問題來改善。目前這款模型還有一些前瞻挑戰有待解決,像是一張圖多次對話修改後品質下滑的問題,或是同一場景中多個角色的圖像品質改善等。目前,Gemini應用App是Nano Banana的主要消費端平臺,還沒有將這款模型發展成獨立App的規畫。
David Sharon透露,我們很興奮地嘗試和致力於可以讓Gemini生成的圖片能自動製作影片,從圖片到影片的跨模態運用這項功能是我們的關注範圍,但是目前沒有時間表。
熱門新聞
2025-12-12
2025-12-16
2025-12-15
2025-12-15
2025-12-15
2025-12-15
2025-12-16
2025-12-15