文章来源:放心AI网发布时间:2025-05-09 17:47:46
在人工智能领域,大语言模型的"幻觉问题"一直是困扰业界的关键挑战。近日,一项基于HHEM-2.1-Open评估体系的测试结果显示,智谱AI旗下的GLM-4-9B模型交出了一份令人瞩目的成绩单。
测试数据显示,在参与评估的85个大语言模型中,GLM-4-9B以98.7%的事实一致性率和100%的回答率摘得桂冠。特别值得关注的是,该模型的幻觉率仅为1.3%,这一成绩不仅位居榜首,更是超越了行业巨头OpenAI的GPT系列和Google的Gemini系列模型。
图源备注:图片由AI生成,图片授权服务商Midjourney
这一突破性成果标志着中国大语言模型在降低"幻觉率"方面取得重要进展,为提升AI应用的可靠性和准确性带来新的可能。这不仅体现了智谱AI在模型研发上的技术实力,也为全球AI领域树立了新的标杆。
在当前AI技术竞争日益激烈的背景下,GLM-4-9B模型的出色表现无疑将为智谱AI赢得更多关注,同时也为中国AI企业在国际舞台上赢得了更多话语权。
相关攻略 更多
最新资讯 更多
智谱GLM-4-9B模型幻觉率仅1.3%,在全球大模型评测中夺魁
更新时间:2025-05-09
71%消费者期待生成式AI改变购物体验
更新时间:2025-05-09
AI客服不好使?多地将人工客服列为急需人才
更新时间:2025-05-09
银河通用发布全新具身抓取大模型GraspVLA,开启智能机器人新纪元
更新时间:2025-05-09
夸克登顶中国AI应用活跃用户总榜00后用户数量占比第一
更新时间:2025-05-09
利用OpenAI实时语音API构建智能语音应用的全新指南
更新时间:2025-05-09
NVIDIA与联发科联手推出迷你AI超级计算机
更新时间:2025-05-09
OpenAI机器人被指控对小型电子商务网站发起DDoS攻击并窃取数据
更新时间:2025-05-09
微软在新诉讼中指控开发工具的团队滥用其人工智能服务
更新时间:2025-05-09
开源推理AI模型Sky-T1横空出世,训练成本不到450美元
更新时间:2025-05-09