文章来源:放心AI网发布时间:2025-04-18 12:17:07
2025年3月3日,通义灵码宣布上线其最新推理模型Qwen2.5-Max,为开发者带来强大的编程和数学能力支持。Qwen2.5-Max使用了超过20万亿token的预训练数据,并结合精心设计的后训练方案,展现出卓越的性能。
在多项基准测试中,Qwen2.5-Max表现突出。例如,在Arena-Hard、LiveBench、LiveCodeBench和GPQA-Diamond等测试中,Qwen2.5-Max的成绩领先于业界其他领先模型,包括DeepSeek V3、GPT-4o和Claude-3.5-Sonnet。此外,在MMLU-Pro等评估中,Qwen2.5-Max也展现了极具竞争力的成绩。
在基座模型的对比中,Qwen2.5-Max与DeepSeek V3、Llama-3.1-405B以及Qwen2.5-72B等模型进行了全面比较。结果显示,通义千问的基座模型在多数基准测试中都展现出显著优势。
值得注意的是,三方基准测试平台Chatbot Arena公布的最新大模型盲测榜单中,Qwen2.5-Max超越了DeepSeek-V3、Open AI o1-mini和Claude-3.5-Sonnet等模型,以1332分位列全球第七名,成为中国非推理类大模型的冠军。在数学和编程等单项能力上,Qwen2.5-Max排名第一,硬提示(Hard prompts)能力排名第二。Chatbot Arena官方评价称,阿里巴巴的Qwen2.5-Max在多个领域表现强劲,尤其是在编程、数学和硬提示等专业技术领域。
目前,Qwen2.5-Max已经集成到通义灵码中,用户可以通过下载通义灵码插件来体验其强大的编程能力。
相关攻略 更多
最新资讯 更多
AI语音独角兽ElevenLabs完成2.5亿美元C轮融资,估值突破30亿
更新时间:2025-04-29
百川智能推出国内首个全场景深度思考医疗大模型,革新医学推理方式
更新时间:2025-04-29
奥特曼加码长寿科技:RetroBiosciences欲筹10亿美元,挑战人类寿命极限
更新时间:2025-04-29
OpenAI新成立的PBC部门估值达300亿美元,微软投资股份尚未确定
更新时间:2025-04-29
扎克伯格表示,2025年底Meta将拥有130万个用于AI的GPU
更新时间:2025-04-29
德勤:企业在推行生成式AI项目上面临规模化挑战
更新时间:2025-04-29
AI基础设施争夺战愈演愈烈:OpenAI与微软的微妙关系
更新时间:2025-04-29
聊天机器人平台CharacterAI以第一修正案为由申请驳回与青少年自杀案的诉讼
更新时间:2025-04-29
Deezer日均上传超万首AI音乐,平台开始检测与标记
更新时间:2025-04-29
AI创业公司GameOn创始人与律师妻子被控6000万美元投资诈骗
更新时间:2025-04-29