AI拿下奧數IMO金牌,但數學界的AlphaGo時刻還沒來
日期:2025-08-04 16:46:44 / 人氣:64

近期,2025年國際數學奧林匹克(IMO)在澳大利亞落幕,AI界圍繞“IMO金牌認證”展開了一場激烈的人才與技術話語權爭奪戰。OpenAI和DeepMind先后宣布其模型達到IMO金牌標準,這一成果標志著AI在數學推理能力上取得了顯著躍升,但也引發了關于AI在數學領域地位和前景的諸多討論。
AI在IMO競賽中的表現與競爭
雙雙達到金牌標準
2025年7月20日IMO在澳大利亞閉幕,OpenAI在7月18日晚就宣布其保密推理模型在IMO競賽的6道題目中解出5道,獲得35分,達到金牌線。兩天后,DeepMind也宣布其Gemini Deep Think的進階版本模型同樣達到這一成就,且完全使用自然語言操作,還獲得了IMO官方組委會的證明。
競爭背后的戲劇性
OpenAI提前宣布成績引發爭議,DeepMind的Demis Hassabis公開譴責。此外,媒體曝出DeepMind金牌團隊三名核心研究員被Meta挖角,此前半年DeepMind已有20名員工被挖去微軟,這場頂尖實驗室之間的競爭愈發激烈。
與人類頂尖學生的對比
今年有72位高中生達到金牌標準,其中5位獲得42分滿分,完美解答6道題,而兩個AI模型都只做出5道題,所以說AI在數學能力上勝過人類還為時過早,但這足以證明當下大模型具備優秀的數學能力。
IMO金牌對AI數學推理能力的證明
突破形式化證明限制
此前,DeepMind的AlphaGeometry和AlphaProof等模型雖達到銀牌標準,但使用形式化證明方法,需把自然語言題目“翻譯”成Lean等機器能“看懂”的語言,過程耗時久,遠超IMO比賽限制。而DeepMind最新的Gemini Deep Think模型在完全自然語言輸入輸出的條件下達到金牌標準,直接從自然語言讀題、作答,不依賴形式化工具,這證明了語言模型本身也可完成高難度數學推理,挑戰了部分AI學者認為語言模型無法獨立完成真正數學推理的觀點。
引發學術觀點變化
此前一些AI學者認為AI模型必須依托形式化語言輸出可機器驗證的邏輯結構,再人工轉換成自然語言,如AlphaProof這樣的“混合模型”才可能達到數學研究標準。但Gemini Deep Think的成功讓數學家可能改變把電腦輔助數學與形式化方法等同的看法。
前IMO金牌得主對AI解題的評價
解答思路與表現
前IMO中國國家隊成員胡蘇麟點評,AI作答的五道題思路清晰、邏輯鏈條完整,獲得滿分實至名歸。不過,在具體題目上兩個AI表現有差異。如第二題平面幾何題,DeepMind的解法更幾何、自然,接近人類選手思路,OpenAI則使用解析幾何手段,將幾何題轉化為代數題,計算量巨大,人類選手考場一般不會這么做。
語言風格差異
兩個AI解答時會不斷引入新符號定義概念或公式,這在高中競賽中不常見,會增加理解難度。OpenAI語言風格更像課堂老師,有人性化描述詞,會適當省略細節、循循善誘;DeepMind語言更書面化,像閱讀數學論文。
AI用于數學研究的前景分歧
積極觀點
IMO競賽只是數學能力的一個側面,與生活中的數學和數學家的研究目標不同。澳籍華人數學家陶哲軒認為,2023年AI就能為職業數學家生成有啟發性的提示和思路,2026年與形式化證明及驗證等結合使用的AI將成為數學研究中值得信賴的合作者,能在一定程度上幫助數學家。
消極觀點
哥倫比亞大學的數學家Michael Harris批判AI數學,認為數學的真正意義在于自由探索和內在洞見,而非淪為市場邏輯下的技術產品。像Lean這樣的計算機語言將數學簡化成機器能看懂的邏輯,使數學失去自由創造和思辨力。他關注數學研究資本化趨勢,擔心資助者以應用價值衡量數學,忽視其內在價值,認為當前關于AI輔助數學的討論忽略了根本問題。
促進學術研究觀點
DeepMind的Pushmeet Kohli認為,AI在數學上的成就會促進數學學術研究,如同圍棋選手分析AlphaGo策略發現新理論一樣,AI系統能為數學家和科學家提供強大工具,幫助他們理解世界。
作者:杏耀注冊登錄測速平臺
新聞資訊 News
- 科學是如何淪為了大國博弈的棋子...11-23
- 大疆“密會”投資機構:不提上市...11-23
- 奧特曼都點贊,谷歌Gemini 3 P...11-23
- 吉爾莫·德爾·托羅《弗蘭肯斯坦...11-23

