OpenAI 這次不是在賣功能,而是在拿一個 79 年的數學問題做壓力測試。官方說,一個通用推理模型推翻了單位距離問題裡長年被視為合理的猜想:在平面上放入 n 個點,能形成多少對恰好相距 1 的點對。這種題目看起來很冷門,但它其實很能測出一個系統是否真的能沿著長鏈條維持一致推理,而不是只會把答案包裝得像答案。
單位距離問題最有名的直覺解法,是把點排成方格,讓距離 1 的邊盡量多。Erdős 1946 年提出這個問題後,很多數學家都傾向認為方格構造已經接近極限。OpenAI 這次給出的訊息卻是,模型找到了一個新的無窮族例子,帶來多項式級別的改進;而且這個證明已經被外部數學家檢查過。這裡真正重要的,不是它贏了誰,而是它把「原本以為封頂」的直覺,往前硬推了一格。

更有意思的是方法。OpenAI 說,這個證明不是靠一個專門為數學訓練的系統,也不是靠針對單一題目做過度微調,而是來自一個通用推理模型,外加搜尋證明策略的流程。它最後借用了代數數論裡很深的工具,例如 class field towers 和 Golod–Shafarevich theory。這種跨域跳接很像 AI 在研究工作裡最值錢的部分:不是把既有知識重新排列,而是把看似不相干的工具拿來對準一個老問題。
這也把 AI 研究的下一個瓶頸照得更亮。現在的比賽早就不只是模型會不會答題,而是能不能把長推理撐住、能不能產生可驗證的中間步驟、能不能在專家審查下站得住。數學是最乾淨的壓力測試,因為每一段論證都要對得上。若這類系統繼續往前,它們最先改變的,可能不是大眾日常使用的聊天介面,而是研究者怎麼分配閱讀、嘗試與驗證的時間。
但這種結果也不該被過度神化。這不是 AI 已經「懂了數學」,而是它開始能在某些高度結構化的領域裡產出真正有價值的推進。那代表人類研究者的角色沒有消失,反而更關鍵:誰來挑題目、誰來判斷哪條線值得追、誰來確認證明是否真的成立,這些還是人類的責任。AI 能把搜尋空間拉寬、把嘗試速度拉快,但最後把門打開的,仍然是能讀懂結果的人。
參考來源
- OpenAI: An OpenAI model has disproved a central conjecture in discrete geometry — https://openai.com/index/model-disproves-discrete-geometry-conjecture/
- Unit distance proof — https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-proof.pdf
- Unit distance remarks — https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-remarks.pdf