文章来源:放心AI网发布时间:2025-04-18 11:12:19
xAI 最近发布了一则激动人心的消息,其最新 AI 模型 Grok-3在 Chatbot Arena 排行榜上表现突出。这款模型被命名为“grok-3preview-02-24”,在多个关键领域展现了卓越性能。
xAI 的 Grok-3-Preview-02-24就以1分的微弱优势超越 GPT4.5-Preview。Grok-3获得了超过3,000票,并总体上与第一名并列。它在困难提示、编码任务、数学问题、创意写作、指令遵循以及处理较长查询方面表现尤为出色。Chatbot Arena 是一个通过人类偏好进行大规模语言模型(LLM)评估的众包平台,使用 Elo 评级系统为模型排名,提供全面的性能衡量。
这一成就标志着 xAI 和其创始人埃隆·马斯克在 AI 发展领域的显著进展。马斯克一直倡导开发强大且与人类价值观相符的 AI。Grok-3在这一基准测试中的成功凸显了模型的能力,以及 xAI 在竞争激烈的 AI 领域的进步。
值得注意的是,“grok-3preview-02-24”被描述为最新生产模型,但名称中包含“preview”,这可能表明它仍处于测试阶段,这一细节可能引发对其完全生产就绪性的讨论。
上一篇: Anthropic完成35亿美元融资:估值飙升至615亿美元,AI竞赛再添强劲一员
人工智能初创公司 Anthropic 今日宣布,已成功完成一轮35亿美元的融资,投后估值高达615亿美元。这一消息在 X 平台上迅速传播,成为科技界关注的焦点。本轮融资由知名风险投资公司光速创投(Lightspeed Venture P
下一篇: 华科字节推出Liquid:重新定义多模态模型的生成与理解
近年来,大语言模型(LLM)在人工智能领域取得了显著进展,尤其是在多模态融合方面。华中科技大学、字节跳动与香港大学的联合团队最近提出了一种新型的多模态生成框架 ——Liquid,旨在解决当前主流多模态模型在视
相关攻略 更多
最新资讯 更多
AI语音独角兽ElevenLabs完成2.5亿美元C轮融资,估值突破30亿
更新时间:2025-04-29
百川智能推出国内首个全场景深度思考医疗大模型,革新医学推理方式
更新时间:2025-04-29
奥特曼加码长寿科技:RetroBiosciences欲筹10亿美元,挑战人类寿命极限
更新时间:2025-04-29
OpenAI新成立的PBC部门估值达300亿美元,微软投资股份尚未确定
更新时间:2025-04-29
扎克伯格表示,2025年底Meta将拥有130万个用于AI的GPU
更新时间:2025-04-29
德勤:企业在推行生成式AI项目上面临规模化挑战
更新时间:2025-04-29
AI基础设施争夺战愈演愈烈:OpenAI与微软的微妙关系
更新时间:2025-04-29
聊天机器人平台CharacterAI以第一修正案为由申请驳回与青少年自杀案的诉讼
更新时间:2025-04-29
Deezer日均上传超万首AI音乐,平台开始检测与标记
更新时间:2025-04-29
AI创业公司GameOn创始人与律师妻子被控6000万美元投资诈骗
更新时间:2025-04-29