奈米香蕉模型爆紅，上線10天生成破2億張圖，下周小改版將支援更高解析度的圖片

奈米香蕉模型爆紅，上線十天生成超過2億張圖片，亞太地區最夯，「公仔提示」是排名第一的模型生成提示。

奈米香蕉模型大爆紅，Google公布這款新模型的最新使用數據，上線十天，已經生成超過2億張圖片，尤其是亞太地區參與度最積極，甚至領導了全世界的用法。臺灣爆紅的「公仔提示」，正是奈米香蕉（Nano Banana）模型生成圖片的第一名提示。

Google早在3月時，就發表了第一款圖片編輯模型Gemini 2.0 Flash，可以透過多輪的對話，來修改圖片的內容，這款模型大受好評，但是用戶希望有更好的圖片編輯能力，特別想保留自己的模樣。

上週二(8/26)，Google推出了新款的圖片編輯模型Gemini 2.5 Flash Image，也就是大家熱烈討論的Nano Banana模型，負責Gemini應用多模態生成技術的Google產品經理David Sharon表示：「這款模型最大的突破點是，可以保留原圖的相似性和臉部特徵，讓使用者可以用全新的方式想像自己。」

新款模型大受好評，上線才十天，全球爆量生成了超過2億張圖片，Gemini應用程式也多了1千萬名新用戶。Google特別對亞太區用戶的參與程度感到驚訝，特別是泰國、印尼和菲律賓。菲律賓生成超過2千5百萬張圖片，印尼2千萬張，泰國也多達1850萬張之多。David Sharon強調：「亞太地區領導了全世界怎麼使用這款新模型。」

像是，有人會生成自己在不同年齡的模樣，或是自己身處在不同年代，60、70、80年代，或是在知名電影場景中的模樣。在泰國、印尼和菲律賓最瘋傳的就是「公仔提示」，把自己變成一個3D公仔和包裝盒，這是目前第一名的提示指令。

Nano Banana模型背後包括了兩套模型，一款是專門生成圖片的擴散模型(Diffusion Model)，也就是可以產生高度擬真圖片的Imagen 4，另一套則是Gemini模型，像是Gemini Flash 2.5或Pro 2.5，透過Gemini模型的邏輯、推理、程式開發和世界知識，來教導擴散模型如何生成圖片。這款模型也是一個多工模型，可以用來做不同的任務。

目前的奈米香蕉模型版本，還沒釋出Google計畫提供的最佳解析度版本，David Sharon透露，模型端和用戶端還有一些問題需要處理，預計下周的模型更新，就可以提供比現在更高解析度的圖片，也開放下載，至於4K解析度等更好畫質的版本，則還沒有釋出的計畫。

每一張從Google模型生成的圖片，都會隱藏了SynthID的隱形數位浮水印，可以用來判斷一張圖是否是Googel的AI所生成。凡是透過Google任何服務，進行任何處理的AI圖片，都會保留原始的浮水印。Google正在開發一款消費端工具，可以讓一般用上傳圖片來檢查。

為了避免圖片生成工具遭到濫用，Google內部進行了大量紅隊測試、評估和政策討論，也提供許多防護柵欄和安全過濾器，SynthID數位浮水印也是其中一項因應機制。

Google透露，未來半年的首頁目標是服務使用者，因為用戶成長速度非常驚人，我們正全力跟上這個需求，並根據用戶回饋的問題來改善。目前這款模型還有一些前瞻挑戰有待解決，像是一張圖多次對話修改後品質下滑的問題，或是同一場景中多個角色的圖像品質改善等。目前，Gemini應用App是Nano Banana的主要消費端平臺，還沒有將這款模型發展成獨立App的規畫。

David Sharon透露，我們很興奮地嘗試和致力於可以讓Gemini生成的圖片能自動製作影片，從圖片到影片的跨模態運用這項功能是我們的關注範圍，但是目前沒有時間表。

熱門新聞