EMMA

简介：EMMA是一款基于Gemini模型的端到端自动驾驶多模态模型，可直接从原始相机传感器数据生成驾驶轨迹并执行多种任务，如3D对象检测、道路图元素识别及场景理解。该模型利用自然语言处理技术实现跨任务协作，并展现出强大的泛化能力，但在某些方面仍需改进。

AI小编 630 阅读 0 评论 38 点赞

官网地址

EMMA是由Waymo开发的一款基于Gemini模型的端到端自动驾驶多模态模型。该模型能够直接将原始相机传感器数据转换为与驾驶相关的输出，例如规划轨迹、感知目标以及识别道路元素。EMMA通过将非传感器输入与输出表达为自然语言文本，并借助预训练的大型语言模型的知识库，在统一的语言空间内协同处理多种驾驶任务。尽管EMMA在nuScenes运动规划和Waymo开放数据集上的表现优异，但仍存在一些限制，如处理图像帧数量有限、缺乏精确的3D传感整合以及较高的计算成本。然而，它对推动自动驾驶架构的发展及提升复杂场景下的泛化与推理能力具有重要意义。

本文分类：AI项目与工具
本文标签：自动驾驶多模态学习端到端模型自然语言处理感知系统道路图构建场景理解路径规划计算效率复杂环境应对
浏览次数：630 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/10645.html

评论列表共有 0 条评论

暂无评论

EMMA

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复