Google釋出Gemini 2.5 Flash Image，已整合至Adobe與OpenRouter

圖片來源:

Google

Google周二（8/26）正式推出內部代號為「奈米香蕉」（nano-banana）的圖像生成模型Gemini 2.5 Flash Image。新模型提升了畫質與控制力，同時強調角色一致性、多圖融合及語意導向編輯能力，並首度與Adobe及OpenRouter合作，擴大應用生態。

Google是在去年底開始小規模地測試Gemini 2.5 Flash上的圖像生成能力，繼之於今年3月透過Google AI Studio擴大實驗規模至全球市場，而Gemini 2.5 Flash Image應是它的首個正式版本。

Gemini 2.5 Flash Image有4個主要特色，包括能讓同一人物或產品在不同場景中保持外觀一致的角色一致性；讓用戶以自然語言指令精準修改圖像，例如模糊背景、去除污漬，甚至是改變姿勢；多圖融合能力允許開發者可將多張圖像合成，輕鬆將物件放入新場景；還能整合世界知識，理解手繪圖表及教育應用，處理複雜的編輯需求。

新模型可透過Gemini API與Google AI Studio使用，定價為每百萬輸出Token收費30美元，由於每張圖像約需要1,290個Token，平均每張圖像約0.039美元。同時，所有生成與編輯的圖像都將附帶SynthID數位浮水印，以確保透明度與追溯性。

Adobe已宣布將Gemini 2.5 Flash Image模型整合至Adobe Firefly及Adobe Express，前者為Adobe於2023年推出的生成式AI圖像與設計平臺，後者屬於大眾化的多合一內容創作平臺。Adobe表示，不管是社交平臺創作者、行銷人員或是視覺設計師都能利用該模型來實現使用者的創意。

圖片來源／Adobe

Adobe用戶可免費生成20張圖像，付費訂閱則能解鎖無限使用。

此外，Gemini 2.5 Flash Image也已成為OpenRouter上首個支援圖像生成的模型，宣稱可用來生成網站頁面、製作角色一致的漫畫分鏡，以及建立大量不同版本的標誌設計。

2023年創立的OpenRouter為一模型中介平臺，定位為AI模型的App Store，讓開發人員可透過單一API介面存取不同的AI模型，目前已支援超過480種模型，從文字、程式碼到圖像生成。

熱門新聞