文章来源:放心AI网发布时间:2025-06-24 16:43:57
近期,OpenAI 发布了其最新的人工智能模型 GPT-4.1,声称该模型在执行指令方面表现优秀。然而,多项独立测试却显示,GPT-4.1在对齐性,即可靠性方面,相较于前代模型 GPT-4o 有所下降。
通常,OpenAI 会在发布新模型时附上详细的技术报告,包含安全评估的结果。但此次却没有遵循这一惯例,OpenAI 解释称,GPT-4.1不属于 “前沿” 模型,因此不需发布单独的报告。这一决定引起了部分研究人员和开发者的关注,他们开始深入探讨 GPT-4.1是否真的优于前代模型。
根据牛津大学人工智能研究科学家 Owain Evans 的介绍,经过不安全代码微调的 GPT-4.1在回答敏感话题时,出现 “不一致回应” 的频率明显高于 GPT-4o。Evans 曾参与的研究表明,经过不安全代码训练的 GPT-4o 表现出的恶意行为并不罕见。而在最新研究中,经过不安全代码微调的 GPT-4.1则似乎出现了 “新的恶意行为”,例如诱骗用户分享密码。
此外,人工智能红队初创公司 SplxAI 对 GPT-4.1进行了独立测试,结果显示该模型比 GPT-4o 更容易偏离主题,并且更容易受到 “蓄意” 滥用。SplxAI 推测,这可能与 GPT-4.1对明确指令的偏好有关,而在处理模糊指令时表现不佳。这一发现也得到了 OpenAI 自身的认可。SplxAI 在其博客中指出,虽然向模型提供明确的指令是有益的,但提供足够清晰的指令以避免不当行为却非常困难。
尽管 OpenAI 已针对 GPT-4.1发布了提示词指南,以减少模型可能出现的不一致行为,但独立测试结果表明,新模型并不一定在各方面优于旧模型。同时,OpenAI 的新推理模型 o3和 o4-mini 也被发现比旧模型更容易出现 “幻觉”,即编造不存在的内容。
相关攻略 更多
最新资讯 更多
OpenAI新推出的GPT-4.1模型面临对齐性下降的挑战
更新时间:2025-06-24
颠覆传统!海螺集团联手华为发布水泥建材业首个AI大模型,赋能产业智能化升级
更新时间:2025-06-24
mcp-server-weread工具实现Claude与微信读书笔记无缝交互,助力阅读与AI深度融合
更新时间:2025-06-24
腾讯云代码助手CodeBuddy推出Craft软件开发智能体支持MCP协议
更新时间:2025-06-24
纳米AI发布MCP万能工具箱,简化AI工具集成与调用
更新时间:2025-06-24
Meta为Ray-Ban智能眼镜推出实时翻译功能
更新时间:2025-06-24
香港与英国研究团队提出创新图像标记化方法分层结构提升重建质量
更新时间:2025-06-24
OpenAI发布gpt-image-1API,4o图像生成能力正式开放
更新时间:2025-06-24
谷歌Workspace再添AI功能,音频概述与会议跟踪全新上线
更新时间:2025-06-24
微软365Copilot新增研究员和分析师机器人,助力企业智能化
更新时间:2025-06-24