圖片來源: 

Google

Google上周公布Bard底層最新多模態AI模型Gemini,不過在媒體記者質疑後,Google承認一段Gemini超神奇表現的影片,其實是編造的結果。

在上周一段名為Hands-on with Gemini: Interacting with multimodal AI的影片中,展示Gemini能理解影片中事物或活動,並與使用者流暢對話,也顯示Gemini想超越OpenAI的GPT-4的企圖心。

在影片中,Gemini能隨著用戶筆順猜出鴨子、理解拳頭、指頭比出2和5是「剪頭、石頭、布」的遊戲,並正確猜出紙團藏在哪個倒扣的杯子下、也能指出太陽、地球和土星的正確順序。影片顯示Gemini能接受文字、圖片、聲音、影片和程式碼的多模態輸入,且具備近乎人類的推論與對話能力,還能正確說出「鴨子」的中文。Google說,這支影片突顯了他們最喜歡和Gemini之間的互動,但為示範效果之故,減少了AI的延遲性、也精簡了Gemini的輸出。

Gemini實在太神奇,或許神奇得不像真的。《彭博》報導,Google承認,這段影片中Gemini其實並非「看到」影片的即時回應,而是以原始影片的靜態影格剪接而成,再配上文字提示。

報導指出,雖然Google有說明影片為了效果而經過優化,但仍然誤導觀眾相信Gemini可看懂影片,並和人類之間可以即時產生流暢對話。

Google向《The Verge》說明,影片旨在向開發人員展示Gemini會產生什麼多模態使用者體驗,他們並且重申並非造假,團隊真的有提供Gemini圖像及文字提示,讓它回應預測下一步為何。

報導或許會讓Google丟掉好不容易掙回的面子。在OpenAI宣布ChatGPT後感到不安的Google宣布以Bard急起直追,不料展示大會上卻被爆Bard找來的James Webb太空望遠鏡影像是另一座望遠鏡照片的張冠李戴,致使外界認為Google AI技術還不成熟。

上周Gemini的展示原希望能一掃Google Bard出糗的恥辱,正面的媒體評價也讓Google股價上揚5%。不過在《彭博》、《The Verge》、《Techcrunch》報導後,再度引發市場對Google是否能趕上OpenAI ChatGPT的疑慮,致使股價再度由升轉跌,一度超過2%。

熱門新聞

Advertisement