文章来源:放心AI网发布时间:2025-05-01 09:53:54
近日,北京月之暗面科技有限公司宣布其旗下智能助手 Kimi 迎来了重大技术升级,推出了全新的 k1.5多模态思考模型。这一模型在多模态推理和通用推理能力上达到了行业领先水平,标志着 Kimi 在人工智能领域的又一次突破性进展。
k1.5多模态思考模型是 Kimi 在短短三个月内第三次对其 k 系列强化学习模型进行重磅升级。继去年11月发布的 k0-math 数学模型和12月发布的 k1视觉思考模型之后,k1.5模型在基准测试中表现卓越。在 short-CoT 模式下,k1.5的数学、代码、视觉多模态和通用能力大幅超越了全球范围内短思考 SOTA 模型 GPT-4o 和 Claude3.5Sonnet 的水平,领先幅度高达550%。而在 long-CoT 模式下,k1.5的数学、代码和多模态推理能力也达到了长思考 SOTA 模型 OpenAI o1正式版的水平,这在全球范围内是 OpenAI 之外的公司首次实现 o1正式版的多模态推理性能。
此次升级的背后是 Kimi 技术团队的不懈努力和创新。团队首次公开了详细的模型训练技术报告《Kimi k1.5:借助大语言模型实现强化学习的 Scaling》,记录了新技术范式下的模型训练探索之路。
报告指出,k1.5模型的关键创新包括长上下文扩展,通过部分展开技术提高训练效率,同时观察到上下文长度的增加能够持续提升模型性能。此外,改进的策略优化方法和简洁的框架设计也为模型的强大性能提供了支持。值得注意的是,k1.5模型在文本和视觉数据上进行了联合训练,具备了联合推理两种模态的能力,尤其在数学能力方面表现出色,尽管在处理部分依赖图形理解的几何图形题时仍存在挑战。
为了进一步提升短链思维推理能力,团队还提出了有效的 long2short 方法,利用 Long-CoT 技术改进 Short-CoT 模型,在 AIME、MATH500和 LiveCodeBench 等测试中取得了显著成绩,大幅超越了现有的短链思维模型,如 GPT-4和 Claude Sonnet3.5。
k1.5多模态思考模型的预览版将陆续灰度上线 Kimi.com 网站和最新版本的 Kimi 智能助手 app。用户在使用过程中如果发现模型切换按钮,即可体验这一全新升级的模型。k1.5模型擅长深度推理,能够帮助用户解决复杂的代码问题、数学问题和工作难题。
月之暗面科技有限公司表示,2025年将继续沿着既定路线图加速升级 k 系列强化学习模型,带来更多模态、更多领域的能力和更强的通用能力,为用户解锁更多可能性。
github 报告链接:https://github.com/MoonshotAI/kimi-k1.5
上一篇: DeepSeek推出全新推理模型DeepSeek-R1性能比肩OpenAI-o1
2025年1月20日,DeepSeek 宣布推出其首个通过强化学习 (RL) 训练的推理模型 DeepSeek-R1,该模型在多个推理基准测试中取得了与 OpenAI-o1-1217相当的性能。 DeepSeek-R1基于 DeepSeek-V3-Base 模型,并采
下一篇: 大模型新突破:从教学视频中提炼高质量多模态教科书
近日,浙江大学与阿里巴巴达摩院联合发布了一项引人瞩目的研究,旨在通过教学视频创建高质量的多模态教科书。这一创新的研究成果不仅为大规模语言模型(VLMs)的训练提供了新的思路,也可能改变教育资源的利用方
相关攻略 更多
最新资讯 更多
淘天推出创新对齐方法,解决视觉大模型中的幻觉问题
更新时间:2025-05-06
OpenAI几周内发布o3-mini,性能略逊于o1-pro
更新时间:2025-05-06
Runway推全新AI图像生成器Frames,打造电影级视觉表现
更新时间:2025-05-06
微软推出WindowsAI搜索功能测试,提升文件查找体验
更新时间:2025-05-06
OpenAI专家:社交媒体上的AI炒作远比你想象的复杂!
更新时间:2025-05-06
AI始祖重生:世界首个聊天机器人ELIZA在60年后重获新生
更新时间:2025-05-06
大型出版公司Dotdash与OpenAI达成合作,裁员百余人
更新时间:2025-05-06
阶跃星辰上线Step-2mini、Step-2文学大师版语言模型
更新时间:2025-05-06
MiniMax海螺语音全球同步上线包含T2A-01-Turbo等模型
更新时间:2025-05-06
MIT、DeepMind研究揭示视觉语言模型无法理解否定表达的原因
更新时间:2025-05-06