在幾周前尚無對手的OpenAI GPT-4,最近忽然冒出了4個競爭對手,它們分別是Google的Gemini 1.5、Mistral AI的Mistral Large、Anthropic的Claude 3,以及Inflection AI的Inflection-2.5,這些在這一個月以來陸續現身的新模型皆宣稱足以比美GPT-4,當中令研究人員覺得最有希望的則是Claude 3。
開發Bito AI程式碼撰寫工具的Bito曾比較了Gemini 1.5 Pro與GPT-4 Turbo,發現Gemini 1.5 Pro在一般推論及理解任務,影片理解,以及音訊處理上勝過GPT-4 Turbo。而GPT-4 Turbo則在解決複雜數學問題的能力,程式碼生成或圖像理解上優於Gemini 1.5 Pro,認為它們的最佳應用將取決於當前任務的特定需求。
而在Mistral AI發表Mistral Large之後,即在OpenAI論壇掀起了討論,有研究人員提出,Mistral Large幾乎在所有基準測試上都不如GPT-4 ,但它的價格只有GPT-4的8成,詢問是否值得切換。底下的回應分成兩派,一派認為GPT-4 Turbo不管是在推論或解決複雜問題上都大勝Mistral Large,所生成的答案也更為精確,很值得那多出的20%,另一派則是推崇Mistral AI的開源政策。
至於鎖定資料科學、機器學習與AI的內容網站KDnuggets認為,Anthropic所發表的Claude 3在所有LLM基準測試中都優於GPT-4和Gemini Ultra,已是AI領域新的領導者,而且3.0版最明顯的改善為視覺能力,使得它可以處理包括照片、圖表、圖像與技術圖等各種視覺格式。
只不過,即使基準測試領先GPT-4,但Claude 3的速度仍不如GPT-4和Gemini Ultra。
Reddit上也有GPT-4 Turbo與Claude 3 Opus比較的討論,多數人贊成Claude 3 Opus的寫作與處理文章的能力勝過GPT-4 Turbo,有人說GPT-4 Turbo對複雜問題的處理能力優於Claude 3 Opus,有人說Claude 3 Opus所生成的程式碼品質與GPT-4 Turbo相當,但更人性化。
總之,不少人認為Claude 3 Opus很有前途。
而Inflection AI所推出的Inflection-2.5模型則是應用在Pi聊天機器人上,是個強調同理心的聊天機器人。Inflection-2.5的基準測試都只是接近GPT-4水平,並未超越,但其進行訓練所使用的運算量,只有GPT-4的40%。目前並未特別有人比較Inflection-2.5與GPT-4。
上述的AI新創每家都有實力堅強的背景,例如Mistral AI的多名共同創辦人分別曾是Google DeepMind與Meta的AI研究人員;Anthropic則是由曾擔任OpenAI研究副總裁的Dario Amodei,以及其妹妹、同樣身為OpenAI資深員工的Daniela Amodei共同創立;Inflection AI的共同創辦人暨執行長Mustafa Suleyman也是DeepMind的共同創辦人,之後於Google負責將AI整合到各種Google產品中。
多款足以與GPT-4比美的模型在短時間內相繼問世,令外界訝異AI世界的成長速度,也相信現在最強大的GPT-4很快就會成為大型語言模型的平均值。
熱門新聞
2024-12-03
2024-11-20
2024-11-15
2024-11-15