文章来源:放心AI网发布时间:2025-04-20 11:30:13
微软在其官网上正式发布了多模态 AI Agent 基础模型 “Magma”,并进行了开源。这一新兴技术相较于传统的智能助手,展现出了更为强大的多模态能力,能够处理图像、视频、文本等多种数据形式,打破了数字与物理世界之间的壁垒。
Magma 不仅可以帮助用户在电商平台上自动下单,查询天气等日常事务,还能与实体机器人协作,执行更复杂的操作。比如,在下真实象棋时,Magma 能够为用户提供实时的策略建议,大大增强了游戏体验。同时,它具备心理预测功能,能够推测视频中的人物或物体的未来行为,让虚拟助手或机器人更好地理解周围的动态环境并做出相应反应。
根据官方介绍,Magma 的应用场景非常广泛。它不仅能帮助家用机器人学习如何整理那些它从未见过的物品,还能为虚拟助手生成不熟悉任务的逐步用户界面导航说明。这样的功能,使得用户在面对新环境或新任务时,能得到更为精准的帮助和指引。
Magma 是属于视觉语言动作(VLA)基础模型的一部分,能够通过海量公开视觉和语言数据进行学习。这一能力使得 Magma 能有效融合语言、空间和时间智能,为用户在数字与物理世界中的复杂任务提供解决方案。
Magma 的开源为开发者和研究人员提供了一个强大的工具,促进了智能助手和家用机器人的进一步发展。未来,随着这一技术的不断完善,我们或许能够在日常生活中看到更多基于 Magma 的创新应用。
项目地址:https://microsoft.github.io/Magma/
上一篇: 智元机器人AgiBotDigitalWorld仿真框架上线,数据集丰富多样
智元机器人今日正式宣布推出自主研发的大型仿真框架AgiBot Digital World,为机器人操作提供灵活的仿真数据生成方案、预训练的大规模仿真数据和统一的模型评测标准,并同步开源海量仿真数据。AgiBot Digital Worl
下一篇: OpenAI免费开放ChatGPT高级语音聊天模式基于GPT-4omini
2月26日,OpenAI公司在X平台发布推文,正式向广大用户宣布,即日起将免费开放ChatGPT的高级语音模式(Advanced Voice Mode)。据悉,ChatGPT的高级语音模式基于GPT-4o mini模型,通过优化计算效率,在性能方面已
相关攻略 更多
最新资讯 更多
OpenAI几周内发布o3-mini,性能略逊于o1-pro
更新时间:2025-05-06
Runway推全新AI图像生成器Frames,打造电影级视觉表现
更新时间:2025-05-06
微软推出WindowsAI搜索功能测试,提升文件查找体验
更新时间:2025-05-06
OpenAI专家:社交媒体上的AI炒作远比你想象的复杂!
更新时间:2025-05-06
AI始祖重生:世界首个聊天机器人ELIZA在60年后重获新生
更新时间:2025-05-06
大型出版公司Dotdash与OpenAI达成合作,裁员百余人
更新时间:2025-05-06
阶跃星辰上线Step-2mini、Step-2文学大师版语言模型
更新时间:2025-05-06
MiniMax海螺语音全球同步上线包含T2A-01-Turbo等模型
更新时间:2025-05-06
MIT、DeepMind研究揭示视觉语言模型无法理解否定表达的原因
更新时间:2025-05-06
商汤日日新融合大模型交互版开放商用实时音视频对话限时免费
更新时间:2025-05-06