文章来源:放心AI网发布时间:2025-06-06 16:16:45
最近,Waymo 在自动驾驶领域又迈出了重要一步。这家公司一直以来都把与谷歌 DeepMind 的合作视作自己的竞争优势,如今,他们正在利用谷歌的多模态大型语言模型 Gemini 来提升其自动驾驶出租车的训练效果。
Waymo 发布了一篇新的研究论文,介绍了一种名为 EMMA 的 “端到端多模态模型”,该模型能够处理传感器数据,从而生成自动驾驶汽车的未来行驶轨迹。这意味着 Waymo 的无人驾驶车辆可以更智能地做出行驶决策,并能有效地避开障碍物。
这项新技术的重要性不仅在于它的创新,还因为它可能改变目前大多数大型语言模型的应用范围。Waymo 希望将 MLLM 视为其自动驾驶系统的 “一级公民”,这代表着未来的自动驾驶可能会与当前的聊天机器人或图像生成器有很大的不同。
在这篇论文中,Waymo 提到,传统的自动驾驶系统通常会为各种功能开发特定的 “模块”,包括感知、映射、预测和规划等。虽然这种方法在过去几年内取得了一些进展,但它的局限性也显而易见,尤其是在应对新的复杂环境时。Waymo 认为,像 Gemini 这样的 MLLM 可以解决这些问题,因为它们具备广泛的 “世界知识”,并且能够进行 “链式思维推理”,模拟人类的逻辑推理。
EMMA 模型被开发出来是为了帮助 Waymo 的自动驾驶出租车在复杂环境中进行导航。比如,当遇到动物或道路施工等情况时,EMMA 能够帮助无人驾驶汽车找到最佳行驶路径。不过,Waymo 也意识到 EMMA 还有一些局限性,例如目前无法处理来自激光雷达或雷达的3D 传感器输入。
Waymo 在这方面的研究还需要进一步深入,但他们希望这项成果能激励更多的研究,以应对目前存在的问题,推动自动驾驶技术的发展。
相关攻略 更多
最新资讯 更多
谷歌旗下Waymo利用Gemini模型提升无人驾驶技术
更新时间:2025-06-06
字节,悄咪咪做了个Liblib
更新时间:2025-06-06
谷歌Gemini分屏功能全面扩展,多款安卓平板和折叠屏设备获支持
更新时间:2025-06-06
迪士尼推全新AI图像压缩方法:能保留图片细节,却有“幻觉”风险
更新时间:2025-06-06
通义AI辟谣亿级投放费用:数据严重失实,实际投入没那么多
更新时间:2025-06-06
扎克伯格透露Meta将向美国政府推广Llama人工智能
更新时间:2025-06-06
字节跳动推出AI模型社区平台:炉米Lumi类似Liblib和CIvitai
更新时间:2025-06-06
字节跳动内测AI模型分享社区“炉米Lumi”
更新时间:2025-06-06
开发者推出基于AI的Reddit选情分析系统实时监测2024美国大选舆论
更新时间:2025-06-06
字节跳动AI新作:炉米Lumi平台首次曝光,打造一站式AI模型共创社区
更新时间:2025-06-06