文章来源:放心AI网发布时间:2025-06-19 14:32:10
在电脑智能体(Computer Use Agent)领域,最近有一个激动人心的进展。上海交通大学与 SII 的研究团队,借助仅312条人类标注的操作轨迹,成功训练出了名为 PC Agent-E 的新一代开源电脑智能体,其性能提升高达241%,超越了著名的 Claude3.7Sonnet,成为 Windows 系统上的新一代最优模型。
自从 Anthropic 推出 Claude Computer Use 以来,电脑智能体的发展一直备受关注。OpenAI 也相继发布了 Operator,通过强化学习技术提升电脑智能体的能力。然而,业界普遍认为,要想达到这样的水平,需要大量的轨迹数据和复杂的强化学习算法。面对这种观点,上海交通大学和 SII 的团队用实际成果反驳了这一说法:只需少量的高质量数据,便能激发智能体的潜力。
这项研究的关键在于如何有效利用人类的操作轨迹。研究团队仅用了两名研究者一天的时间,通过开发的工具 PC Tracker,收集到了312条真实的操作轨迹。这些轨迹包含任务描述、屏幕截图以及详细的键盘和鼠标操作记录,确保了数据的准确性。在这之后,研究团队还为这些轨迹进行了 “思维链补全”,即为每个动作提供了背后的思考过程,使得数据更加完整。
为了进一步提升模型的性能,团队引入了 “轨迹增强” 技术。通过使用 Claude3.7Sonnet,研究人员为每一步的操作合成了多个合理的动作决策,这样不仅增加了轨迹数据的多样性,也显著提高了训练的效率。最终,PC Agent-E 在 WindowsAgentArena-V2的测试中表现出色,超越了 Claude3.7Sonnet 的 “extended thinking” 模式。
这项研究的成果显示,使用少量高质量的数据即可实现强大的智能体训练,不再需要海量的标注数据。这为未来更智能的数字代理的发展指明了方向,团队也认为,通过提高轨迹数据的质量,可以有效降低数据需求,推动智能体的自主性提升。
论文地址:https://arxiv.org/abs/2505.13909
代码地址:https://github.com/GAIR-NLP/PC-Agent-E
模型地址:https://huggingface.co/henryhe0123/PC-Agent-E
数据地址:https://huggingface.co/datasets/henryhe0123/PC-Agent-E
相关攻略 更多
最新资讯 更多
312条轨迹助力241%性能提升,上交大与SII开源电脑智能体引领新潮流
更新时间:2025-06-19
全球首次发现OpenAI模型能无视关机指令,AI自我保护引发关注
更新时间:2025-06-19
AI新手福音!AingDesk一键打造智能助手,多模型对话即将引爆
更新时间:2025-06-19
AI神器LlamaParse:一键解锁PDF表格与文档,效率飙升的秘密武器!
更新时间:2025-06-19
智元机器人灵犀X2启动合作伙伴招募,目标2026年实现数千台出货
更新时间:2025-06-19
AI开发神器Rork:一句话打造iOS+Android应用,零编程也能当开发者!
更新时间:2025-06-19
AI教育革命!VideoTutor一句话即可生成K12定制教学视频
更新时间:2025-06-19
谷歌重磅发布三大Gemma模型变体,AI医疗、手语翻译与海豚语言解锁新可能!
更新时间:2025-06-19
Youware重磅更新:MCP加持一键生成复杂网页,AI建站进入新时代!
更新时间:2025-06-19
星门计划震撼全球!美阿联酋联手打造5吉瓦AI超级枢纽,算力革命来了!
更新时间:2025-06-19