视频

Google Beam

Google Beam是谷歌推出的AI驱动的3D视频通信平台,能够将2D视频流转换为逼真的3D效果,提升远程通话的自然度和直观性。用户可实现眼神交流和细微表情识别,增强沟通效果。支持实时语音翻译,打破语言障碍,并基于Google Cloud提供企业级可靠性,适用于远程协作、教育、医疗、国际合作和个人社交等多种场景。

Video Diffusion Models

Video Diffusion Models项目展示了扩散模型在视频生成领域的潜力,通过创新的梯度条件方法和自回归扩展技术,生成了具有高度时间连贯性和质量的视频样本。

DreamVideo

DreamVideo-2是一款由复旦大学和阿里巴巴集团等机构共同开发的零样本视频生成框架,能够利用单一图像及界定框序列生成包含特定主题且具备精确运动轨迹的视频内容。其核心特性包括参考注意力机制、混合掩码参考注意力、重加权扩散损失以及基于二值掩码的运动控制模块,这些技术共同提升了主题表现力和运动控制精度。DreamVideo-2已在多个领域如娱乐、影视制作、广告营销、教育及新闻报道中展现出广泛应用前

瓦兔漫剪工厂

一款帮助漫剪达人制作漫剪视频的辅助软件,其中集成文字转语音、频文字提取、漫画对白遮挡,自动搭配画面转场、音效、背景音乐等众多漫画剪辑功能,是一款漫剪小白也能一键使用的漫剪神器。

MultiTalk

MultiTalk是由中山大学深圳校区、美团和香港科技大学联合推出的音频驱动多人对话视频生成框架。它根据多声道音频输入、参考图像和文本提示,生成包含人物互动且口型与音频一致的视频。通过Label Rotary Position Embedding (L-RoPE) 方法解决多声道音频与人物绑定问题,并采用部分参数训练和多任务训练策略,保留基础模型的指令跟随能力。MultiTalk适用于卡通、歌唱及

Google Vids

一款由谷歌在2024年推出的人工智能驱动的视频创作工具,专为职场设计,目的在于简化和加强工作环境中的视频创建和编辑流程。

RecCloud

一个人工智能驱动的多媒体服务平台,RecCloud专门为视频和音频处理提供一套全面的工具。

Hyring

Hyring 是一款基于 AI 的招聘工具,支持视频面试、动态问题生成、多语言交流及 AI 抄袭检测,提升招聘效率与公平性。提供数据驱动的评估报告、灵活面试设置及候选人管理功能,适用于各类企业与全球招聘场景,助力高效人才筛选。

ImageToVideo AI

ImageToVideo AI 是一款基于人工智能的图像转视频工具,能够将静态图片转化为动态视频。通过智能分析图像内容并结合用户输入的文本指令,可添加动画、转场、音乐、字幕等元素,生成高质量、富有表现力的视频。支持多种格式输出,提供丰富的模板和自定义选项,适用于个人创作、内容制作、教育及广告等多种场景,提升视频制作效率与视觉效果。

度加剪辑

度加剪辑,百度官方出品,口播自媒体必备剪辑工具,专为知识创作者而作。