-
潘禺:今年有另一場更值得關注的數學競賽
【文/觀察者網專欄作者 潘禺】
今年,一場數學競賽初賽結果的出圈傳播,導致了媒體的聚焦和全社會的討論。而在該事件不久之后,其實還有另外一場數學競賽的結果,具有深遠的影響和重要的意義,在媒體上得到的關注卻小得多。那就是2024年的國際數學奧林匹克競賽 (IMO),主角中同樣有科技互聯網巨頭的身影,Google DeepMind的人工智能AlphaProof和AlphaGeometry 2,答對了6道題中的4道,首次達到了IMO銀牌獲獎者的水平。
AlphaProof解決了2道代數問題和1道數論問題,包括本屆IMO中最難的問題,只有5名參賽者解決了這個問題。AlphaGeometry 2證明了幾何問題,而2個組合問題AI沒能解決。每道題最高可得7分,總共最高42分。人工智能的最終得分為28分,在解決的每個問題上都獲得了滿分,相當于銀牌類別的最高水平,因為今年的金牌從29分開始。
這一結果表明,AI處理復雜數學推理能力有了顯著飛躍。而數學推理是人類認知能力的一個重要方面,推動了科學發現和技術進步。
對中國來說,這一結果也意味著重大的機遇和挑戰。
中國的人工智能企業在一些領域處于領先地位,比如圖像識別。這是因為,人臉識別、物體檢測、醫療影像分析等許多技術成果,已經應用在支付、安防、智慧零售、交通監控和智能醫療等,相比于AI的其它應用領域,是率先落地的。又得益于中國巨大的人口規模和豐富的應用場景,加上基建項目的政策與資金支持,中國企業能積累大量的圖像數據,進而推動了模型的訓練和算法的優化,在各類國際比賽中處于領先。
下一個在中國能廣泛應用于實際場景的AI領域是哪里呢?有潛力的肯定包括智能網聯車和文體教等,這些也是國內企業投入的重點。中國社會歷來高度重視教育,家庭在教育上的投入巨大,學區房、課外輔導、留學費用等占到了許多家庭支出的大頭。AI對教育的改變,將深刻沖擊中國社會,數學這一被中國人視為重中之重的基礎學科,又是我們觀察這種影響的一個窗口。
從計算到證明
雖然數學一直被稱為人類心智的榮耀,但人類使用機器作為數學的輔助,有著幾千年的歷史。
早在公元前2400年,類似算盤這樣的工具就已經被發明。17世紀的科學家和發明家布萊茲·帕斯卡(Blaise Pascal)發明了早期的機械計算器,這種機器可以進行簡單的加減運算。20世紀60年代,第一臺電子計算器問世。早在20世紀70年代到80年代,世界上的部分高中和大學考試就開始允許學生使用計算器,90年代起,許多國家的教育體系開始正式將計算器作為教學工具,并編寫了相應的課程,鼓勵學生使用計算器進行復雜運算。
美國的SAT數學考試在1994年首次允許學生使用計算器。目前,世界許多國家的標準化數學考試,如AP數學考試、SAT、ACT以及國際數學競賽,允許考生使用特定類型的計算器。用計算器可以幫助學生專注于數學概念的理解,而非繁瑣的計算,這已經沒有太大爭議。中國的基礎數學教育以嚴格和系統著稱,中國學生在PISA這類國際數學評估中的表現十分優異,盡管我們注重學生的計算能力,但也并不在高考中排斥計算器的使用。
機器幫助人類解決數學計算,無論在日常生活、教學還是科研領域,都已經被普遍接受。強大的數學計算工具如MATLAB、Mathematica、Maple已經是許多人工作的必備,適合簡單數學運算和統計分析的Excel更是普及。而在數學證明上,目前機器也在發揮越來越大的作用,這正是巨大變革可能產生的開始。
這次在IMO 2024,數學家陶哲軒做了一場演講,回顧了從早期計算工具到現代的機器學習,數學研究的范式轉變。他談到了許多例子,心智觀察所在這里結合自己的理解做一些總結和評論。
第一個例子是表格。數學領域的許多重要成果都是通過數論中的表格首次發現的,許多猜想也是通過大量的表格發現的。表格可以理解為數據庫,計算機的一個基本用途就是建立這些有用的數據庫。比如,很多數學家,包括陶哲軒自己,使用一個叫做“整數序列在線百科全書”(Online Encyclopedia of Integar Sequences,OEIS)的數據庫。
第二個例子是科學計算。比如用計算機來建模各種事物,求解大量線性方程或偏微分方程,這幾乎是現代科學研究和工程應用的基石,從天氣預報到風洞實驗,從新材料和藥物的研發到期權定價、核反應堆設計,其應用無處不在。
另一種科學計算是SAT求解器,可以解決一些邏輯難題(布爾可滿足性問題),其原理是通過檢查大量的布爾變量,尋找是否存在一組變量的賦值,使得整個布爾公式為真。通俗地說,比如給你1000個陳述,有的是真的,有的是假的,再給你一些限制條件、變量和法則,讓你證明某些句子的組合邏輯上是真的。通過把數學問題,比如畢達哥拉斯三元組問題,轉換為布爾邏輯問題,利用SAT求解器強大的組合求解能力,能夠有效尋找整數解。
第三個例子是形式化證明輔助。四色定理(任一地圖只用四種顏色就能讓相鄰的國家染上不同的顏色)和開普勒猜想(在三維空間中最有效地堆疊球體,以最大限度填充空間)的證明,都是計算機輔助證明的著名例子。
為了更加簡潔地形式化復雜的證明過程,數學家開始使用Lean平臺,Lean將數學命題用形式化語言表達并通過計算機驗證,使得每一個推理步驟都可以自動檢查。這為數學研究提供了極大的便利,也降低了證明復雜定理的出錯率。目前本科數學課程中的基礎內容,比如微積分、群論或拓撲學的基本概念等,都已經被形式化,更多數學領域的內容也在被加入到這個庫中。
數學家Peter Scholze就利用Lean試圖形式化驗證自己的高深數學理論,這些理論需要高層次數學背景和對非常抽象的概念的理解,涉及到對現代代數幾何、范疇論、同調代數和拓撲學的深入掌握。Scholze對自己的證明存有疑慮,也沒有人有本事詳細查看其中的細節。Lean的形式化證明如果能夠成功,意味著形式化數學能處理現代數學的前沿問題。用Lean證明費馬大定理的項目,目前也已經獲得資助并啟動。
陶哲軒自己則致力于以眾包方式來用Lean探索數學。其方法是為大型的復雜證明編寫一個藍圖,將證明分解成數百個小步驟,每個步驟都可以單獨形式化,然后組合起來,最后將長達數萬行的形式化證明轉換回人類可讀的版本,最后這步也是計算機自動生成的。
這樣的好處是,證明過程更加開放,讓數學家們可以更好地分工合作,每個人處理任務圖中自己負責的部分,通常是自己擅長解決的,而不需要理解整個證明。由于Lean可以自動檢查,就能保證每個人的工作達到質量標準。另外,遇到修改,編譯器會自動指出關聯的地方,不需要像傳統的方式重寫整個證明,效率大大提高。
最后一個例子就是當下炙手可熱的機器學習。
標簽 心智觀察所- 原標題:今年有另一場更值得關注的數學競賽 本文僅代表作者個人觀點。
- 責任編輯: 李昊 
-
中國貨運航天飛機,來了
2024-10-30 07:26 航空航天 -
馬斯克擁抱特朗普的隱秘心境,藏在這部美劇中
2024-10-29 14:35 心智觀察所 -
神十九將帶果蠅上太空 小鼠:等我
2024-10-29 13:34 航空航天 -
我國首艘深遠海多功能科學考察及文物考古船完成試航
2024-10-26 19:44 中國精造 -
“把大象裝進冰箱”,鴻蒙為什么行?
2024-10-25 14:41 心智觀察所 -
我國科研人員揭示過敏反應關鍵機制
2024-10-25 13:40 -
我國成功發射天平三號衛星
2024-10-22 08:55 航空航天 -
肖克利的幽靈重現硅谷
2024-10-22 08:39 心智觀察所 -
中方代表:防止出現機器自主殺人
2024-10-22 08:26 科技前沿 -
中國科學家讓“死亡”50分鐘豬腦“復活”
2024-10-20 15:05 科技前沿 -
污蔑寧德時代,美國有著怎樣的怨念與悔恨?
2024-10-17 14:33 心智觀察所 -
我國成功發射高分十二號05星
2024-10-16 08:33 航空航天 -
我國首個空間科學規劃公布!明確這些目標
2024-10-15 09:54 航空航天 -
拿下諾貝爾化學獎的中國血統,還將拯救谷歌?
2024-10-15 08:33 心智觀察所 -
星艦第五次試飛實現重大突破,但我國類似火箭可能得等一等
2024-10-13 23:04 航空航天 -
中國汽車電子產業將站上兩個世界之巔
2024-10-12 08:29 心智觀察所 -
世界最大!地下700米的這個玻璃球,將探尋宇宙之初
2024-10-11 10:00 科技前沿 -
我國成功發射衛星互聯網高軌衛星
2024-10-10 22:49 航空航天 -
我國科技成果轉化問題到了必須要解決的地步
2024-10-08 16:58 心智觀察所 -
2024年諾貝爾生理學或醫學獎揭曉
2024-10-07 17:45 諾貝爾獎
相關推薦 -
“臺積電答應美方要求,急于向特朗普證明…” 評論 15“中國提議交換樣本,美方至今沒吭聲” 評論 447安排10萬億為地方政府減負,對中國經濟意味著什么? 評論 167“他,殺死了美國司法” 評論 223五角大樓“緊張”:一旦他下這種命令,該如何應對? 評論 200最新聞 Hot