2024 年 12 月 23 日 11:44:00,OpenAI o3 如同一颗重磅炸弹,突然在科技领域引爆。这个备受瞩目的发布,引起了全球范围内的广泛关注。
经历了漫长的 12 天技术分享直播活动后,OpenAI 终于在最后一天放出大招,推出了下一代推理模型 o3。这一模型是今年早些时候发布的 o1 推理模型的升级版本。有意思的是,此次发布的模型有 o3 和 o3-mini 两个版本,后者是精简版,针对特定任务进行了微调。OpenAI 声称,在某些条件下,o3 模型可以接近实现 AGI,也就是通用人工智能,能够完成人类所能完成的任何任务。
o3 的强大实力令人惊叹。在 ARC-AGI 图形逻辑推理基准上,o3 获得了破纪录的分数。低计算场景中,得分高达 75.7%,高计算测试中更是达到了 87.5%,超过了标志着达到人类水平的门槛 85%。相比之下,o1 模型的得分仅在 25% 到 32% 之间,o3 的表现几乎是 o1 的三倍。在全球著名的编码竞赛平台 Codeforces 评分中,o3 取得了 2727 的高分,而 o1 评分仅为 1891。
猎豹移动 & 猎户星空董事长傅盛对 o3 的发布给予了高度评价。他表示,随着 OpenAI o3 的发布,人人都是程序员的时代即将到来。人们再也不必因为不会 Python、不会 C++ 等编程语言而不敢写程序,只需说出需求,大预言模型就能帮你写程序。傅盛感慨道,程序员可能要不存在了。在他看来,o3 的发布标志着大语言模型的编程能力超越了 99.9% 的程序员。在 Codeforces 世界级编程比赛中,OpenAI o3 取得了 175 名的顶尖成绩,要知道这是在 17 万程序员中的排名。而 o1 大概只战胜 90% 多的程序员,之前的 GPT-4o 只战胜 11% 的程序员。
据悉,OpenAI o3 将于明年 1 月底正式发布。傅盛称,人类程序员这次真的危险了。虽然说程序员不存在了可能有点夸张,但程序员的工作重心将更多地放在对用户需求的理解和大逻辑的构建上,而把代码实现的工作大幅度地交给 AI 去完成。