GPT-4競爭者報到：Gemini 1.5、Mistral Large、Claude 3 Opus與Inflection-2.5

在幾周前尚無對手的OpenAI GPT-4，最近忽然冒出了4個競爭對手，它們分別是Google的Gemini 1.5、Mistral AI的Mistral Large、Anthropic的Claude 3，以及Inflection AI的Inflection-2.5，這些在這一個月以來陸續現身的新模型皆宣稱足以比美GPT-4，當中令研究人員覺得最有希望的則是Claude 3。

開發Bito AI程式碼撰寫工具的Bito曾比較了Gemini 1.5 Pro與GPT-4 Turbo，發現Gemini 1.5 Pro在一般推論及理解任務，影片理解，以及音訊處理上勝過GPT-4 Turbo。而GPT-4 Turbo則在解決複雜數學問題的能力，程式碼生成或圖像理解上優於Gemini 1.5 Pro，認為它們的最佳應用將取決於當前任務的特定需求。

而在Mistral AI發表Mistral Large之後，即在OpenAI論壇掀起了討論，有研究人員提出，Mistral Large幾乎在所有基準測試上都不如GPT-4 ，但它的價格只有GPT-4的8成，詢問是否值得切換。底下的回應分成兩派，一派認為GPT-4 Turbo不管是在推論或解決複雜問題上都大勝Mistral Large，所生成的答案也更為精確，很值得那多出的20%，另一派則是推崇Mistral AI的開源政策。

至於鎖定資料科學、機器學習與AI的內容網站KDnuggets認為，Anthropic所發表的Claude 3在所有LLM基準測試中都優於GPT-4和Gemini Ultra，已是AI領域新的領導者，而且3.0版最明顯的改善為視覺能力，使得它可以處理包括照片、圖表、圖像與技術圖等各種視覺格式。

圖片來源／Anthropic

只不過，即使基準測試領先GPT-4，但Claude 3的速度仍不如GPT-4和Gemini Ultra。

Reddit上也有GPT-4 Turbo與Claude 3 Opus比較的討論，多數人贊成Claude 3 Opus的寫作與處理文章的能力勝過GPT-4 Turbo，有人說GPT-4 Turbo對複雜問題的處理能力優於Claude 3 Opus，有人說Claude 3 Opus所生成的程式碼品質與GPT-4 Turbo相當，但更人性化。

總之，不少人認為Claude 3 Opus很有前途。

而Inflection AI所推出的Inflection-2.5模型則是應用在Pi聊天機器人上，是個強調同理心的聊天機器人。Inflection-2.5的基準測試都只是接近GPT-4水平，並未超越，但其進行訓練所使用的運算量，只有GPT-4的40%。目前並未特別有人比較Inflection-2.5與GPT-4。

上述的AI新創每家都有實力堅強的背景，例如Mistral AI的多名共同創辦人分別曾是Google DeepMind與Meta的AI研究人員；Anthropic則是由曾擔任OpenAI研究副總裁的Dario Amodei，以及其妹妹、同樣身為OpenAI資深員工的Daniela Amodei共同創立；Inflection AI的共同創辦人暨執行長Mustafa Suleyman也是DeepMind的共同創辦人，之後於Google負責將AI整合到各種Google產品中。

多款足以與GPT-4比美的模型在短時間內相繼問世，令外界訝異AI世界的成長速度，也相信現在最強大的GPT-4很快就會成為大型語言模型的平均值。

熱門新聞