上证指数 3830.65 -0.03%
|
深证成指 13117.47 0.32%
|
恒生指数 26576.59 0.12%
|
纳斯达克 22470.73 0.94%
|
日经225指数 45139.87 -0.36%
|
Vicky 初级编辑
240 文章
327867 阅读
首页  >  要闻 >  商业 >  正文
申请成为签约作者 >
GPT-5在2025 ICPC世界决赛中获得满分 超越人类
2025年09月19日 02:38    
收藏  
举报

2025年9月,国际大学编程竞赛(ICPC)世界决赛在葡萄牙波尔图举行,汇集全球顶尖大学程序员与AI系统。OpenAI的GPT-5以惊人表现夺冠,解决全部12道算法题,获得满分12/12,超越圣彼得堡国立大学(11/12)和谷歌Gemini 2.5 Deep Think(10/12)。

比赛条件严格:所有参赛者,包括AI,在5小时内使用相同PDF问题,提交至本地评判系统,无定制工具。GPT-5的11道题首次提交即正确,最难一题(涉及复杂图论与动态规划)在9次迭代后解决,调用了未发布的实验模型。

ICPC题目涵盖数据结构、图论、动态规划和计算几何,难度极高,考验逻辑推理与代码优化。GPT-5的成功源于其高级推理能力,能够解析自然语言问题、生成高效C++代码并自我调试。圣彼得堡国立大学队长表示:“AI的表现令人震惊,它在时间复杂度和代码鲁棒性上超越了我们。”谷歌Gemini 2.5虽答对10题,但因优化不足失分,凸显GPT-5在复杂问题上的优势。

令人瞩目的是,GPT-5及其实验模型未针对ICPC进行专门训练。OpenAI首席科学家Ilya Sutskever表示:“GPT-5的设计目标是通用推理能力,ICPC只是其能力的自然延伸。”这一组合延续了其在2024年国际数学奥林匹克(IMO)和国际信息学奥林匹克(IOI)的辉煌:IMO获6/6金牌,IOI解决8/8题目,均依赖GPT-5与实验模型的协同。实验模型(代号“DeepSolve”)据信是OpenAI的强化推理模块,优化了最优路径搜索和错误修正。

GPT-5的推理飞跃令人感慨。2024年9月,OpenAI发布o1-preview,首次展示高级推理能力;短短一年,GPT-5已从“实验”跃升为“霸主”。其核心在于多模态推理:解析PDF问题、生成算法逻辑、优化代码,并在迭代中动态调整。ICPC最难题目(涉及NP-hard问题)耗时4小时,GPT-5通过实验模型的9次迭代,从初始超时到最优解,展示出类似人类的“试错学习”。

ICPC主办方为AI设立单独排名,确保公平性。人类团队仍以圣彼得堡国立大学为首(11/12),清华大学和麻省理工学院并列第三(9/12)。谷歌Gemini 2.5 Deep Think虽表现不俗,但因推理深度不足,未能匹敌GPT-5。主办方表示:“AI的参与推动了赛题设计进化,未来可能引入‘AI专属’难题。”

AI在竞技编程的突破引发热议。xAI首席技术官表示:“GPT-5的表现不仅是技术胜利,更是通用智能的里程碑。”

GPT-5的满分壮举不仅震撼学术界,还预示AI在算法优化领域的商业潜力。

2025年,全球算法市场规模达500亿美元,涵盖金融交易、物流优化和药物设计。GPT-5的推理能力可加速高频交易策略开发(提升效率20%)和供应链优化(节省成本15%)。英伟达已宣布与OpenAI合作,集成GPT-5至其AI平台,预计2026年收入增10亿美元。

谷歌Gemini的10/12成绩虽落后,但其Deep Think模式优化了搜索算法,2025年广告收入或增5%。其他AI如DeepMind的AlphaCode也在追赶,2024年IOI得分7/8,显示竞争加剧。OpenAI的未发布模型或进一步拉开差距,预计2026年GPT-5商业应用覆盖50%算法市场。

GPT-5的ICPC胜利标志AI推理能力从实验室走向现实。短短一年,从o1-preview到满分称霸,AI进化速度令人叹服。2026年,ICPC或引入更复杂题目,如实时并行计算,挑战AI极限。OpenAI计划发布“DeepSolve”模块,支持开发者定制算法Agent,类似MuleRun的AI市场。

GPT-5的满分不仅是技术巅峰,更是AI与人类协同的新起点,在算法与创新的赛道上,未来十年将更加波澜壮阔。

声明: 本文由入驻币海编者上传,观点仅代表编者本人,不代表币海财经赞同其观点或证实其描述,请自行判断。
延伸阅读
红地毯、国宴与算术题:特朗普的英国二进宫
   流动的沙        2025/09/18 05:58
通胀分化难阻降息预期!美股齐创新高 中概大反弹
   币海独步者        2025/09/12 01:24
AI强势推动!科技股力挺美股 甲骨文暴涨36%
   币海独步者        2025/09/11 01:19
OpenAI要革好莱坞的命 GPT-5要拍电影了
   股海柠檬精        2025/09/08 08:15
中国大模型开源优势倒逼行业反思
   罗斯巴德        2025/08/27 09:00