视频

ACTalker

ACTalker 是一种基于视频扩散模型的端到端工具,可生成高质量、自然的说话人头部视频。支持多信号控制(如音频、表情),采用并行 Mamba 结构和门控机制,实现跨时间和空间的精准面部动作控制。实验表明其在音频同步性和视频质量上表现优异,适用于虚拟主播、远程会议、在线教育等多种场景。

Colourlab Ai

Colourlab AI是一款利用人工智能技术的色彩分级软件,专为电影和视频制作设计。它提供自动色彩平衡、神经网络外观匹配、自定义参考等功能,简化工作流程并提升效率。软件支持多种相机品牌,适用于电影制作、纪录片、广告、独立电影及网络内容创作等多种场景。

Symphony Creative Studio

Symphony Creative Studio是一款由TikTok开发的AI视频创作工具,专注于简化广告主和内容创作者的视频制作流程。它具备视频生成、转换、扩展以及虚拟人物创作等功能,支持多语言翻译与配音,并可基于品牌IP定制虚拟形象。通过整合多种智能技术,该工具显著提升了内容创作效率与质量。

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架,通过生成高质量事故视频并结合自然语言描述与推理,提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强,支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT,AVD2在多项评估中表现优异,为自动驾驶安全提供了重要技术支撑。

OmAgent

OmAgent是由Om AI与浙江大学滨江研究院联合开发的多模态语言代理框架,支持文本、图像、视频等多种输入形式,简化设备端智能代理的开发流程。它具备高效模型集成、灵活算法接口和复杂任务处理能力,适用于视频监控、内容推荐、教育辅助等场景,提升设备智能化水平和用户体验。

All Voice Lab

All Voice Lab是一款基于AI技术的语音创作平台,提供文本转语音、声音克隆、视频翻译、变声等多种功能,支持多语言及多音色转换。平台具备高精度的语音生成能力,可应用于内容创作、视频制作、教育及娱乐等领域,提升内容表现力与国际化传播效率。

Viggle

Viggle是一个强大的AI视频生成工具,它通过易于使用的命令为用户提供了丰富的视频创作可能性。无论是将静态角色转化为动态视频,还是完全控制角色动作,Viggle都能满足用户的创意...

Drimo

Drimo 是一款面向影视、广告及 AI 视频创作者的智能创作工具,具备剧本生成、剧情构思、角色设定、分镜设计、故事板生成和影片生成等功能。它简化了影视制作流程,降低了专业门槛,适用于创意策划、广告脚本、短片制作及教学视频等多个场景,帮助用户高效完成内容创作。

Video Dubbing

一款具有语音克隆和口型同步功能的AI视频翻译器,可以将视频中的语音转换成多种不同的语言,同时保持与原始视频的音频同步。

Erase.Video

一个视频去水印、字幕、文字、不要的物体工具。用户只需上传视频文件,指定要去除的区域,然后很快下载处理好的视频。