文章来源:放心AI网发布时间:2025-05-07 16:33:10
2025年1月16日,上海阶跃星辰智能科技有限公司宣布其自研推理模型Step Reasoner mini(简称“Step R-mini”)正式上线。用户可登录跃问网页端https://yuewen.cn,在左上角选择“Step R-mini”进行体验。
Step R-mini是Step系列模型家族的首个推理模型,擅长主动规划、尝试和反思,通过慢思考和反复验证的逻辑机制,为用户提供准确可靠的回复。它不仅能够通过超长推理能力解决逻辑推理、代码和数学等复杂问题,还能兼顾文学创作等通用领域。
阶跃星辰自研的Step系列基座模型矩阵已覆盖语言、多模态到推理的全面能力。在AIME和Math等数学基准测试上,Step R-mini的成绩超过了o1-preview,比肩OpenAI o1-mini。在LiveCodeBench代码任务上,也比o1-preview效果更佳。值得一提的是,大部分推理模型难以兼顾文理科双方向能力,但Step R-mini通过大规模的强化学习训练,并使用On-Policy(同策略)强化学习算法,实现了“文理兼修”,既能准确解答数学、代码、逻辑推理问题,又能富有创意地完成文学内容创作和日常聊天的任务。
在实际应用中,Step R-mini展现了出色的效果。在解答数学题时,面对奥数难题,它能构建合理推理链,实现复杂数学问题的规划和逐步求解,并枚举不同解法方案交叉验证。在处理几何题目时,能主动通过画草图构建深度思考的内容介质。在逻辑推理任务中,自主尝试多种解题思路,自我反问确保枚举出所有良好解决方案。在代码题方面,能正确解答LeetCode技术平台上难度评级为“Hard”的算法题,还能处理复杂开发需求,逐步分析用户需求和意图,构建代码逻辑。在内容创作上,能深入理解用户表达需求,分析创作主题、文学题材等要求,思考创作角度、描绘景物、修辞手法、内容结构,赋予事物人类情感层面的象征意义,并增加个性化、创新的表达风格。在翻译问题上,遵循“信达雅”原则,力求呈现精准且含义丰富的翻译结果。
除了语言推理模型,阶跃星辰还在打造视觉推理模型,将推理能力融入更多交互形态的大模型中。针对复杂视觉场景下的Reasoning问题,引入慢感知和空间推理思想,把Test-Time Scaling从文本空间转移到视觉空间,实现在视觉空间下的Spatial-Slow-Thinking。目前,视觉推理模型已取得阶段性成果,正式版本预计今年与大家见面。
相关攻略 更多
最新资讯 更多
阶跃星辰自研推理模型StepReasonermini上线
更新时间:2025-05-07
科大讯飞领投云锦微:打造"万元级"边缘计算解决方案
更新时间:2025-05-07
售价高达1.3万元!智能戒指Rare是科技新宠还是智商税?
更新时间:2025-05-07
在AI版权案,扎克伯格引用YouTube案例为Meta辩护
更新时间:2025-05-07
AI巨头陈天石财富激增至100亿美元,股票飙升500%
更新时间:2025-05-07
智谱发布GLM-4-Air、GLM-4V-Plus模型设立Flash全模态免费模型
更新时间:2025-05-07
阿里云发布全新数学推理模型Qwen2.5-Math-PRM,7B版本超越GPT-4o
更新时间:2025-05-07
IBM与欧莱雅合作开发首个可持续化妆品AI模型
更新时间:2025-05-07
Cerebras与梅奥诊所推出先进的基因组人工智能模型
更新时间:2025-05-07
谷歌公益推出3000万美元生成式AI加速器计划,助力非营利组织
更新时间:2025-05-07