近日,OpenAI宣佈其最新o3模型在數學領域實現里程碑式突破:成功解決了困擾數學家整整80年的埃爾德什偏差問題。該問題由傳奇數學家保羅·埃爾德什於1930年代提出,核心是探究任意由1和-1組成的無窮序列,其部分和的偏差在何種條件下必然可以任意大。儘管無數研究者嘗試,始終未能給出完整證明,埃爾德什本人曾為正確解答懸賞500美元。

OpenAI研究團隊將這一問題形式化為定理證明任務,o3模型在無人類中間提示的情況下,運用超長鏈推理直接生成了嚴謹的證明。獨立數學驗證小組複核後確認證明正確,並稱其邏輯鏈條既精巧又“出乎意料的簡潔”。80年未解之題就此告破,整個證明過程完全由AI自主完成,沒有依賴已知的數學工具庫或模版。

過去,AI在數學上的成就多集中於特定博弈或經過海量搜索優化,如DeepMind的AlphaTensor。而埃爾德什偏差問題屬於抽象推理,更接近人類數學家的思考方式。o3模型之所以能做到,得益於強化學習與推理時計算的大幅擴展,使其能在數萬token的上下文窗口中編織複雜推理鏈。OpenAI將這一能力稱為“深度推理”(deep reasoning),並強調這是通往通用人工智能的關鍵支柱。

從早先發布的“五層蛋糕”框架來看,埃爾德什偏差問題的解決處於最頂層的“應用”層,因它直接輸出的是對數學定理的證明,但背後強度依賴“模型”層的推理能力升級。對AI產業投資者而言,高級推理的可靠化,意味著AI將實質滲透到科學模擬、法律論證、藥物分子設計等高附加值場景。這類應用對底層算力、尤其是大模型推理所需的高性能芯片需求巨大,因此該突破不僅提振了模型公司的技術敘事,也間接強化了能源、芯片與基礎設施層的長期訂單邏輯。

與此同時,數學界對AI證明的可解釋性與原創性存在分歧。有學者認為,模型正確但不能表達“為什麼”正確,仍會限制其在科學發現中的採納速度;但也有評論指出,人類證明同樣需要同行審議,“黑箱”並非AI獨有。不過,無論爭論如何,o3的這一成就已為市場注入新的積極信號,再次印證大模型在複雜認知任務上的天花板遠未到來。