離通用AI更近了！Google DeepMind新AI媲美國際數學奧林匹克金牌的解題能力

Google DeepMind團隊開發一套AI系統AlphaGeometry，可解國際數學奧林匹克（IMO）難題，並在最新的30道題目中，在規定時間內解出25題。不只比過往最佳的AI模型高出15題，還與人類金牌表現相當。

圖片來源:

Google DeepMind

Google DeepMind最近發表一款AI系統AlphaGeometry，使用1億筆合成資料訓練，就能在最新的30道國際數學奧林匹克（IMO）題目中，在規定時間內解出25道題。它不只比先前只解出10題的最佳AI還厲害，表現還接近人類金牌得主的平均值25.9道題，是邁向通用AI的一大里程碑。這項研究成果，日前也登上《Nature》期刊。

最先進的AI系統解幾何學難題，仍是個挑戰

為何AI解幾何學題目很重要？

因為，幾何學是數學最古老、最基礎的分支之一，也是電腦科學、建築、藝術、工程、天文等領域的重要工具。就電腦科學來說，幾何學因涉及空間屬性，例如距離、形狀、大小和相對位置等，是重要的處理工具，尤其能用來設計和分析演算法，執行常見的AI任務，如圖像處理、電腦視覺和動作規畫等。

幾何學也是國際數學奧林匹克競賽的重要課題。這個競賽旨在測驗邏輯推理和發現新知識的能力，每年吸引全球各地優秀的高中生，來挑戰數學難題。

然而，就算是目前最先進的AI系統，都還難以證明數學猜想（Conjecture）的真偽。AI界普遍認為，能證明數學定理，是發展通用AI（即AGI）的關鍵一步，但它有個大挑戰：訓練資料的缺乏。因為，專為AI建立數學證明資料，既困難又昂貴，AI專家們很難收集到足夠的訓練資料，來打造AI解題模型。

根據IMO規則生成1億筆訓練資料，最終解出25道題

為解決這個挑戰，Google DeepMind研究團隊Trieu Trinh和Thang Luong先是根據IMO規則，生成了1億個不同複雜度的數學定理和證明，並用這些合成的訓練資料，從頭訓練出一套AI系統AlphaGeometry。在這個過程中，完全沒使用人工範例。

而在架構上，它是一套神經符號（Neuro-symbolic）系統，採混合式架構，由神經語言模型（NLL）和符號推論引擎（Symbolic deduction engine）2大部分組成。

其中，神經語言模型扮演引導角色，來指導符號推論引擎，如何在IMO等級的問題中，從幾何構造的無限可能中找出解決方案（如下圖）。這是因為，IMO幾何問題以圖形呈現，需要添加新的幾何結構（如點、線、面）才能解題，而AlphaGeometry的語言模型，可以從無數個可能性中，預測出添加哪些新結構最有用。這些線索，能幫助符號引擎進一步推導圖形，找出最接近的解答。

AlphaGeometry如何解決一個簡單問題：首先，給定問題圖形和定理（左），AlphaGeometry（中）接著用符號引擎，來推導圖形的新陳述，直到找到解決方案或新陳述用完為止。若未找到解決方案，AlphaGeometry 的語言模型會添加一個可能有用的構造（藍色部分），給符號引擎新的推導方向。這個循環會一直出現，直到找到解決方案為止（右）。

AlphaGeometry也成功在最新的IMO競賽中，在規定時間內解出25道題（共30題），能力與世界上最聰明的高中數學生相當，媲美歷屆金牌的平均成績25.9道題。

Google認為，這個成功，不只是數學推理上的突破，還能運用到更廣泛的科學領域問題。而且，AlphaGeometry解決專家級的複雜數學問題，未來還能幫助人類更理解世界運作的過程。

熱門新聞