Amazon預覽圖像生成模型、新增文字生成模型

圖片來源:

AWS

Amazon周四在re: Invent大會上公布AWS生成式AI模型產品，包括第一個圖像生成式模型Titan Image Generator，以及文字生成模型Amazon Titan Text Express及Titan Text Lite。

新公布的模型中，Titan Image Generator為Amazon自行開發的Titan家族最新模型之一，使其得以趕上OpenAI、Google、微軟等競爭者，具備圖片編輯及加入浮水印等功能。Titan Text Express及Titan Text Lite則是AI模型平臺Bedrock的新增文字模型。在Bedrock服務平臺上，用戶可以透過Bedrock控制臺直接存取使用，或是以自有資料再加以客製化訓練。

Amazon Titan Image Generator允許用戶以英文自然語言輸入提示視窗，以建立專業等級的圖像，作為廣告、電商平臺，或是媒體與娛樂內容。Amazon表示，這項服務是以高品質而多元化的資料訓練而成，可生成精準、貼近真實、少扭曲，且屬性多元的圖片，並能理解包含多個物件的複雜提示。

Titan Image Generator的圖片編輯功能之一，是利用內建分割模型自動編輯圖片。最新模型支援以圖片遮罩進行修補（inpainting）及以擴展（outpainting）延伸或變更圖片背景。使用者可設定圖片大小、指明想要模型產生幾種款式。用戶也可利用其自有資料客製化模型，以生成和公司品牌指引一致的圖片，或是透過微調令模型生成特定風格的圖像。它也支援負責任AI原則，防止生成有害或惡意的圖片。

此外，有鑒於這模型可被用於生成Deepfake影像，所有以Titan生成的圖片都會加入看不見的浮水印，以利辨識AI生成的圖片。不過Amazon並未說明技術資訊。《The Verge》引述AWS主管指出，這浮水印不會破壞圖片畫質，也無法被裁切或壓縮掉，但使用者需要連結到獨立API以判別是否為AI生成。

AWS還為Bedrock新增了2個Titan文字生成模型Titan Text Express及Text Lite。Titan Text Express為「價格和效能兼顧」的文字生成模型，提供最多8000 token輸入，也可以微調。它支援的情境包含檢索增加生成（retrieval-augmented generation）、開放式文本生成、腦力激盪、摘錄重點、程式碼及表格生成、文本改寫、改述（paraphrasing）、關聯思考（chain of thought）、擷取、問答及聊天等。

而Text Lite版則是為特定使用場景而設計，強調「具成本效益且可高度客製化」的LLM。Lite版最大輸入為4000 token，支援場景包括摘錄重點及文案寫作（copywriting）。

Titan Text Express目前已正式推出英文版，並有100多個語言版本已以預覽版上線，Titan Lite則僅支援英文。

除了主打的圖片生成模型外，AWS昨日還推出Titan多模嵌入（Titan Multimodal Embedding）模型。此一模型可支援多模態提示輸入，包括文字、圖片或者兩者同時輸入。Titan多模嵌入模型支援輸入最高128 token及25MB圖片，僅支援英文。

Titan多模嵌入提供非同步批次API，Amazon OpenSearch Service的神經搜尋（Neural Search）很快也會加入連接器，以便加入Titan多模嵌入模型支援。

熱門新聞