自动驾驶 - 智狐AI导航

R1

R1-Onevision 是一款基于 Qwen2.5-VL 微调的开源多模态大语言模型，擅长处理图像与文本信息，具备强大的视觉推理能力。它在数学、科学、图像理解等领域表现优异，支持多模态融合与复杂逻辑推理。模型采用形式化语言和强化学习技术，提升推理准确性与可解释性，适用于科研、教育、医疗及自动驾驶等场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 517 浏览

GaussianCity

GaussianCity是由南洋理工大学S-Lab团队开发的高效3D城市生成框架，基于3D高斯绘制技术，采用紧凑的BEV-Point表示方法降低显存和存储需求。其空间感知的BEV-Point解码器可生成高质量3D城市场景，支持多样化视角和实时渲染，适用于游戏、影视、城市规划等领域。相比现有方法，其生成速度提升60倍，兼具高效与高质量特性。

AI项目与工具 2025年06月12日 80 点赞 0 评论 476 浏览

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架，通过生成高质量事故视频并结合自然语言描述与推理，提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强，支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT，AVD2在多项评估中表现优异，为自动驾驶安全提供了重要技术支撑。

AI项目与工具 2025年06月12日 62 点赞 0 评论 612 浏览

ReCamMaster

ReCamMaster 是由浙江大学与快手科技联合开发的视频重渲染框架，支持根据用户指定的相机轨迹生成新视角视频。采用预训练模型与帧维度条件机制，实现视频视角、运动轨迹的灵活调整。具备视频稳定化、超分辨率、外扩等功能，适用于视频创作、后期制作、自动驾驶和虚拟现实等领域，提升视频内容的表现力与质量。

AI项目与工具 2025年06月12日 95 点赞 0 评论 485 浏览

RF

RF-DETR是一款由Roboflow推出的实时目标检测模型，支持多分辨率训练，具备高精度和低延迟特性，在COCO数据集上达到60+ mAP。结合Transformer架构和预训练DINOv2主干，提升领域适应性和检测效果。适用于安防、自动驾驶、工业检测等多个场景，提供预训练检查点以支持快速微调和部署。

AI项目与工具 2025年06月12日 35 点赞 0 评论 442 浏览

Amodal3R

Amodal3R 是一种基于条件的 3D 生成模型，能够从部分遮挡的 2D 图像中重建完整的 3D 模型。通过引入掩码加权多头交叉注意力机制和遮挡感知注意力层，提升了遮挡场景下的重建精度。该模型仅使用合成数据训练，却能在真实场景中表现出色，具有较强的泛化能力。广泛应用于 AR/VR、机器人视觉、自动驾驶及 3D 资产创建等领域。

AI项目与工具 2025年06月12日 39 点赞 0 评论 489 浏览

OpenVision

OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列，具备从5.9M到632.1M参数的多种模型，适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略，训练效率比同类模型高2至3倍，在多模态任务中表现优异。支持可变大小patch输入，兼具灵活性与高效性，广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。

AI项目与工具 2025年06月11日 58 点赞 0 评论 427 浏览

WorldMem

WorldMem是由多所高校与研究机构联合开发的AI世界生成模型，通过引入记忆机制解决传统模型在长时间序列生成中的一致性问题。它支持动态环境模拟、多场景交互及长期一致性保持，适用于虚拟游戏、VR/AR、自动驾驶等多个领域，具备高度真实性和可扩展性。

AI项目与工具 2025年06月11日 47 点赞 0 评论 537 浏览

文远知行

全球领先的自动驾驶科技公司，文远知行提供从L2到L4的自动驾驶产品和服务，涵盖Robotaxi、Robobus、Robovan等多种自动驾驶车辆。

Ai科技公司 2025年06月05日 61 点赞 0 评论 833 浏览

YOLOv9

YOLOv9是一款先进的目标检测系统，由台北中研院和台北科技大学的研究团队开发。该系统在YOLO算法系列基础上进行了优化，引入了可编程梯度信息（PGI）和泛化高效层聚合网络（GELAN），显著提升了模型的准确性、参数效率、计算复杂度和推理速度。YOLOv9在多个应用场景中表现出色，包括视频监控、自动驾驶、机器人视觉和野生动物监测。

AI项目与工具 2024年01月01日 91 点赞 0 评论 572 浏览

自动驾驶

首页

自动驾驶

列表

默认

浏览次数

发布日期

R1