Google DeepMind團隊開發一套AI系統AlphaGeometry,可解國際數學奧林匹克(IMO)難題,並在最新的30道題目中,在規定時間內解出25題。不只比過往最佳的AI模型高出15題,還與人類金牌表現相當。

圖片來源: 

Google DeepMind

Google DeepMind最近發表一款AI系統AlphaGeometry,使用1億筆合成資料訓練,就能在最新的30道國際數學奧林匹克(IMO)題目中,在規定時間內解出25道題。它不只比先前只解出10題的最佳AI還厲害,表現還接近人類金牌得主的平均值25.9道題,是邁向通用AI的一大里程碑。這項研究成果,日前也登上《Nature》期刊

最先進的AI系統解幾何學難題,仍是個挑戰

為何AI解幾何學題目很重要?

因為,幾何學是數學最古老、最基礎的分支之一,也是電腦科學、建築、藝術、工程、天文等領域的重要工具。就電腦科學來說,幾何學因涉及空間屬性,例如距離、形狀、大小和相對位置等,是重要的處理工具,尤其能用來設計和分析演算法,執行常見的AI任務,如圖像處理、電腦視覺和動作規畫等。

幾何學也是國際數學奧林匹克競賽的重要課題。這個競賽旨在測驗邏輯推理和發現新知識的能力,每年吸引全球各地優秀的高中生,來挑戰數學難題。

然而,就算是目前最先進的AI系統,都還難以證明數學猜想(Conjecture)的真偽。AI界普遍認為,能證明數學定理,是發展通用AI(即AGI)的關鍵一步,但它有個大挑戰:訓練資料的缺乏。因為,專為AI建立數學證明資料,既困難又昂貴,AI專家們很難收集到足夠的訓練資料,來打造AI解題模型。

根據IMO規則生成1億筆訓練資料,最終解出25道題

為解決這個挑戰,Google DeepMind研究團隊Trieu Trinh和Thang Luong先是根據IMO規則,生成了1億個不同複雜度的數學定理和證明,並用這些合成的訓練資料,從頭訓練出一套AI系統AlphaGeometry。在這個過程中,完全沒使用人工範例。

而在架構上,它是一套神經符號(Neuro-symbolic)系統,採混合式架構,由神經語言模型(NLL)和符號推論引擎(Symbolic deduction engine)2大部分組成。

其中,神經語言模型扮演引導角色,來指導符號推論引擎,如何在IMO等級的問題中,從幾何構造的無限可能中找出解決方案(如下圖)。這是因為,IMO幾何問題以圖形呈現,需要添加新的幾何結構(如點、線、面)才能解題,而AlphaGeometry的語言模型,可以從無數個可能性中,預測出添加哪些新結構最有用。這些線索,能幫助符號引擎進一步推導圖形,找出最接近的解答。

AlphaGeometry如何解決一個簡單問題:首先,給定問題圖形和定理(左),AlphaGeometry(中)接著用符號引擎,來推導圖形的新陳述,直到找到解決方案或新陳述用完為止。若未找到解決方案,AlphaGeometry 的語言模型會添加一個可能有用的構造(藍色部分),給符號引擎新的推導方向。這個循環會一直出現,直到找到解決方案為止(右)。

AlphaGeometry也成功在最新的IMO競賽中,在規定時間內解出25道題(共30題),能力與世界上最聰明的高中數學生相當,媲美歷屆金牌的平均成績25.9道題。

Google認為,這個成功,不只是數學推理上的突破,還能運用到更廣泛的科學領域問題。而且,AlphaGeometry解決專家級的複雜數學問題,未來還能幫助人類更理解世界運作的過程。

熱門新聞

Advertisement