EMMA EMMA是一款基于Gemini模型的端到端自动驾驶多模态模型,可直接从原始相机传感器数据生成驾驶轨迹并执行多种任务,如3D对象检测、道路图元素识别及场景理解。该模型利用自然语言处理技术实现跨任务协作,并展现出强大的泛化能力,但在某些方面仍需改进。 AI项目与工具 2025年06月12日 38 点赞 0 评论 555 浏览
山海大模型 山海大模型是一款由云知声推出的多模态人工智能模型,具备强大的知识储备和多模态交互能力。它能够通过文本、音频和图像等形式与用户进行实时互动,提供信息查询、知识学习和灵感激发等服务。主要功能包括内容生成与理解、知识问答、逻辑推理、代码能力以及多模态交互特色,如实时响应、情绪感知、音色切换和视觉场景理解。该模型可应用于智能客服、教育辅助、医疗咨询、个人助理和内容创作等多个领域。 AI项目与工具 2025年06月12日 55 点赞 0 评论 552 浏览
Rope Rope是一款基于深度学习的开源AI换脸工具,利用insightface的inswapper_128模型提供直观的图形界面,支持图片和视频换脸。它具备强大的遮罩功能和参数调节选项,支持超分辨率算法,广泛应用于影视制作、游戏开发、虚拟现实等领域。 AI项目与工具 2025年06月12日 55 点赞 0 评论 547 浏览
百度AI同传 强大的实时同传工具,它通过百度的AI技术,为用户提供实时的语音识别和多语言翻译服务。这款工具不仅提高了跨语言交流的效率,还极大地方便了国际会议、商务洽谈等多语言环境中的... 创作工具 1970年01月01日 0 点赞 0 评论 546 浏览
ScriptViz ScriptViz是一款基于MovieNet数据库的剧本可视化工具,利用CLIP模型实现剧本文本与电影画面的匹配,支持用户通过SQL语句设定剧本属性并生成视觉化参考。其功能涵盖视觉素材检索、剧本与视觉匹配、故事分析及对话对齐可视化,旨在提升剧本创作过程中的视觉表现力和叙事连贯性。此外,ScriptViz还提供情绪捕捉、场景细化及角色开发等应用,适用于剧本开发、故事板制作等多个场景。 AI项目与工具 2025年06月12日 18 点赞 0 评论 544 浏览