Kimi发布数学推理模型

发布时间:2024-11-19 来源:时事 作者:通悟AI

2024 年 11 月,月之暗面创始人杨植麟在风波后亮相,此次沟通会只谈技术与产品。杨植麟出席小型媒体沟通会,发布 Kimi 数学模型 k0 - math,称该模型会在未来 1 - 2 周内上线 kimi 产品,并披露 10 月使用 Kimi 的人数已超过 3600 万。


在沟通会的分享环节,杨植麟介绍了 k0 - math 的基本指标,与 o1 的评分对比。在中考、高考、考研等考试测试上,k0 - math 表现优于 OpenAI o1,但在数学竞赛 OMNI - MATH 和 AIME 上得分略低于 o1。k0 - math 的技术思路与 o1 类似,也是结合强化学习算法。


杨植麟展示了 k0 - math 的实例,如处理 AIME 数学竞赛题的思考过程。对于简单问题,k0 - math 目前有“过度思考”倾向。未来模型将能自主判断问题的思考时长。


在使用新数学模型上,杨植麟希望将强化学习能力用到搜索场景,与 Kimi 探索版结合,更好地完成复杂搜索。

沟通会后,杨植麟回答了一些提问,涉及预训练、强化学习、多模态模型、Scaling Law 对中美大模型竞争的影响等技术问题,以及产品与商业化、团队等方面的问题。


上一篇: 北大等发布多模态版 o1:LLaVA-o1 引领视觉推理新潮流 下一篇: 通义代码模式:开启大白话生成应用新时代