视频

万兴天幕多媒体大模型

一个涵盖了视觉、音频、语言等多模态AI生成和优化能力的多媒体大模型,万兴天幕多媒体大模型核心功能包括一键成片、AI美术设计、文生音乐、音频增强、音效分析、多语言对话等。

书生·筑梦2.0

它不仅提供了更大的创作灵活性,还通过高质量的视频输出满足了用户对画质和帧率的高需求。Vchitect 2.0及其配套的VEnhancer框架,为视频内容创作者提供了强大的工具,以创造更加生...

豆包Seaweed

豆包Seaweed是一款基于Transformer架构的AI视频生成工具,支持文生视频和图生视频模式,能够生成高逼真度、细节丰富的视频内容,广泛应用于电商、文旅、教育等领域,大幅降低视频制作门槛,提升创作效率。

Gemini 2.0

Gemini 2.0 是谷歌推出的原生多模态AI模型,具备快速处理文本、音频和图像的能力,支持多语言输出和实时音视频流输入。通过Agent技术和工具调用,Gemini 2.0 能够自主理解任务并提供解决方案,已在编程、数据分析、游戏等领域展示应用潜力。目前提供免费试用,计划逐步开放更多功能。

StreamLake虚拟人

基于自研的虚拟人全链路AI技术,提供集虚拟形象建模、绑定驱动、实时渲染、内容运营于一体的虚拟人解决方案。

Haiper AI

一家专注于视觉内容创作的生成式AI解决方案的人工知智能公司, Haiper AI的使命就是开发将文本和图片转换为动态视频或3D的模型。

AI Mirror

AI Mirror是一款基于人工智能技术的照片编辑与视频创作工具,具备丰富的滤镜选择、动漫化处理、角色生成等功能。用户可通过其多样化的编辑工具实现照片美化、风格转换及创意表达,广泛适用于社交媒体分享、节日纪念、艺术创作和个人化礼物制作等场景。

Vecteezy

Vecteezy 是一个提供免费图片、视频和矢量插图等素材的网站

YouTube Summarized

YouTube Summarizedm,这是一个使用人工智能为您总结YouTube视频的网站,还可以可以帮助用户创建笔记或分享视频的精彩片段。

DrivingDojo

DrivingDojo是一个由中国科学院自动化研究所与美团无人车团队合作研发的数据集,包含18,000个视频片段,涵盖全面的驾驶操作、多智能体交互及开放世界驾驶知识。它定义了动作指令跟随(AIF)基准,用于评估世界模型的预测能力,并支持自动驾驶算法开发、世界模型训练、多智能体交互模拟及罕见事件处理等多个应用场景。