银牌组最高分,谷歌 DeepMind 捅破 AI 数学推理上限:6 道国际奥数题解出 4 道
谷歌 DeepMind 团队昨日(7 月 25 日)发布博文,表示其研发的 AlphaProof 和 AlphaGeometry 2 模型可以解决数学中的高级推理问题,在解答国际数学奥林匹克竞赛难题方面达到银牌标准。
AI 会将 IMO 的 6 道题目翻译成为模型可以理解的数学语言。AlphaProof 通过确定答案并证明其正确性,解决了两个代数问题和一个数论问题,而其中解决的 1 个问题是比赛中最难的,在今年的 IMO 中只有 5 位选手解决了这一问题。AlphaGeometry 2 则证明了几何问题,没有解决 2 个组合问题。
按照 IMO 规则,6 道题目每道题可获得 7 分,总分最高为 42 分。DeepMind 系统最终获得了 28 分,每个问题都得到了满分,相当于银牌组的最高分。