
Google周二(8/26)正式推出內部代號為「奈米香蕉」(nano-banana)的圖像生成模型Gemini 2.5 Flash Image。新模型提升了畫質與控制力,同時強調角色一致性、多圖融合及語意導向編輯能力,並首度與Adobe及OpenRouter合作,擴大應用生態。
Google是在去年底開始小規模地測試Gemini 2.5 Flash上的圖像生成能力,繼之於今年3月透過Google AI Studio擴大實驗規模至全球市場,而Gemini 2.5 Flash Image應是它的首個正式版本。
Gemini 2.5 Flash Image有4個主要特色,包括能讓同一人物或產品在不同場景中保持外觀一致的角色一致性;讓用戶以自然語言指令精準修改圖像,例如模糊背景、去除污漬,甚至是改變姿勢;多圖融合能力允許開發者可將多張圖像合成,輕鬆將物件放入新場景;還能整合世界知識,理解手繪圖表及教育應用,處理複雜的編輯需求。
新模型可透過Gemini API與Google AI Studio使用,定價為每百萬輸出Token收費30美元,由於每張圖像約需要1,290個Token,平均每張圖像約0.039美元。同時,所有生成與編輯的圖像都將附帶SynthID數位浮水印,以確保透明度與追溯性。
Adobe已宣布將Gemini 2.5 Flash Image模型整合至Adobe Firefly及Adobe Express,前者為Adobe於2023年推出的生成式AI圖像與設計平臺,後者屬於大眾化的多合一內容創作平臺。Adobe表示,不管是社交平臺創作者、行銷人員或是視覺設計師都能利用該模型來實現使用者的創意。

圖片來源/Adobe
Adobe用戶可免費生成20張圖像,付費訂閱則能解鎖無限使用。
此外,Gemini 2.5 Flash Image也已成為OpenRouter上首個支援圖像生成的模型,宣稱可用來生成網站頁面、製作角色一致的漫畫分鏡,以及建立大量不同版本的標誌設計。
2023年創立的OpenRouter為一模型中介平臺,定位為AI模型的App Store,讓開發人員可透過單一API介面存取不同的AI模型,目前已支援超過480種模型,從文字、程式碼到圖像生成。
熱門新聞
2025-12-12
2025-12-16
2025-12-15
2025-12-15
2025-12-15
2025-12-15
2025-12-16
2025-12-15