DeepMind展示了其在數學領域最新的人工智慧研究,透過結合AlphaProof與AlphaGeometry 2兩個系統,解決了2024年國際數學奧林匹亞競賽(IMO)6道數學難題中的4道題目,達到了與銀牌得主一樣的水準。

由於推理技能和訓練資料的限制,目前人工智慧系統仍然苦手於解決一般數學問題,而擁有先進數學推理能力的通用人工智慧,將有助於發展尖端科學和科技。DeepMind在2024年初的時候,於《自然》期刊發表了能夠解決數學難題的人工智慧模型AlphaGeometry。AlphaGeometry是一個以Gemini語言模型為基礎的神經符號(Neuro-Symbolic)混合系統,透過結合神經網路和符號推理人工智慧技術,解決幾何和數學複雜問題。

DeepMind持續推進在數學領域的人工智慧研究,並透過整合AlphaProof和第二代AlphaGeometry,在2024年國際數學奧林匹亞競賽解題中表現優異。

AlphaProof是一個自訓練並使用形式語言(Formal Language)Lean證明數學陳述的系統,其結合了預訓練語言模型和AlphaZero增強學習演算法。在數學推理任務中,AlphaProof執行自動化證明,生成解答候選方案,並且透過在Lean語言中搜尋可能的證明步驟,來證明或是反駁這些方案。AlphaProof透過每次成功找到並驗證的證明,來持續強化自身能力,以解決更具挑戰的數學問題。

AlphaGeometry 2則是AlphaGeometry的改良版本,其符號引擎比第一代快兩個數量級,面對新問題的時候,AlphaGeometry 2能夠採用新的知識共享機制,實現不同搜尋樹的進階組合,解決更複雜的問題。AlphaGeometry能夠解決IMO 25年歷史考題中的53%,而AlphaGeometry 2能力大幅提升,可以解決其中的83%。

IMO 2024的題目被手動翻譯,以形式化語言Lean表示,提供給DeepMind的人工智慧系統。該系統耗時三天解出其中4道題目,AlphaProof解決了兩個代數問題和一個數論問題,其中有一道是今年最難的題目,所有參賽者僅有5名答對,而AlphaGeometry 2則證明了一道幾何問題,但有兩個組合數學題目沒有解決。

每道題目答對可得7分,而今年IMO金牌門檻分數為29分,有58位參賽者達成,而DeepMind的人工智慧系統則得到28分,每個解決的問題都拿到滿分。在正式比賽共有兩節解題時間,每節4.5小時總共9小時,人工智慧系統則花費了三天的時間解出4題。

熱門新聞

Advertisement