圖片來源: 

AWS

Amazon周四在re: Invent大會上公布AWS生成式AI模型產品,包括第一個圖像生成式模型Titan Image Generator,以及文字生成模型Amazon Titan Text Express及Titan Text Lite。

新公布的模型中,Titan Image Generator為Amazon自行開發的Titan家族最新模型之一,使其得以趕上OpenAI、Google、微軟等競爭者,具備圖片編輯及加入浮水印等功能。Titan Text Express及Titan Text Lite則是AI模型平臺Bedrock的新增文字模型。在Bedrock服務平臺上,用戶可以透過Bedrock控制臺直接存取使用,或是以自有資料再加以客製化訓練。

Amazon Titan Image Generator允許用戶以英文自然語言輸入提示視窗,以建立專業等級的圖像,作為廣告、電商平臺,或是媒體與娛樂內容。Amazon表示,這項服務是以高品質而多元化的資料訓練而成,可生成精準、貼近真實、少扭曲,且屬性多元的圖片,並能理解包含多個物件的複雜提示。

Titan Image Generator的圖片編輯功能之一,是利用內建分割模型自動編輯圖片。最新模型支援以圖片遮罩進行修補(inpainting)及以擴展(outpainting)延伸或變更圖片背景。使用者可設定圖片大小、指明想要模型產生幾種款式。用戶也可利用其自有資料客製化模型,以生成和公司品牌指引一致的圖片,或是透過微調令模型生成特定風格的圖像。它也支援負責任AI原則,防止生成有害或惡意的圖片。

此外,有鑒於這模型可被用於生成Deepfake影像,所有以Titan生成的圖片都會加入看不見的浮水印,以利辨識AI生成的圖片。不過Amazon並未說明技術資訊。《The Verge》引述AWS主管指出,這浮水印不會破壞圖片畫質,也無法被裁切或壓縮掉,但使用者需要連結到獨立API以判別是否為AI生成。

AWS還為Bedrock新增了2個Titan文字生成模型Titan Text Express及Text Lite。Titan Text Express為「價格和效能兼顧」的文字生成模型,提供最多8000 token輸入,也可以微調。它支援的情境包含檢索增加生成(retrieval-augmented generation)、開放式文本生成、腦力激盪、摘錄重點、程式碼及表格生成、文本改寫、改述(paraphrasing)、關聯思考(chain of thought)、擷取、問答及聊天等。

而Text Lite版則是為特定使用場景而設計,強調「具成本效益且可高度客製化」的LLM。Lite版最大輸入為4000 token,支援場景包括摘錄重點及文案寫作(copywriting)。

Titan Text Express目前已正式推出英文版,並有100多個語言版本已以預覽版上線,Titan Lite則僅支援英文。

除了主打的圖片生成模型外,AWS昨日還推出Titan多模嵌入(Titan Multimodal Embedding)模型。此一模型可支援多模態提示輸入,包括文字、圖片或者兩者同時輸入。Titan多模嵌入模型支援輸入最高128 token及25MB圖片,僅支援英文。

Titan多模嵌入提供非同步批次API,Amazon OpenSearch Service的神經搜尋(Neural Search)很快也會加入連接器,以便加入Titan多模嵌入模型支援。

熱門新聞

Advertisement