视频生成 - 智狐AI导航

VideoPhy

VideoPhy是一款由UCLA和谷歌研究院联合开发的基准测试工具，旨在评估视频生成模型的物理常识能力。它包含688条描述性字幕，通过人类和自动评估方式，衡量生成视频是否符合物理规则。VideoPhy不仅揭示了现有模型的不足，还推出了自动评估工具VideoCon-Physics，以推动模型性能的提升。其应用场景广泛，包括视频生成模型开发、计算机视觉研究、教育与培训以及娱乐产业等。

AI项目与工具 2025年06月12日 84 点赞 0 评论 712 浏览

MinT

MinT是一款基于时间基位置编码技术的多事件视频生成框架，允许用户通过文本提示生成包含多个事件的连贯视频，并支持对事件顺序及持续时间的精确控制。其核心技术ReRoPE使得模型能够有效关联文本提示与视频帧，同时结合预训练的视频扩散变换器（DiT）和大型语言模型（LLM）的提示增强功能，进一步提升了视频生成的质量与丰富度。MinT适用于娱乐、广告、教育等多个领域，为视频创作带来了创新性的解决方案。

AI项目与工具 2025年06月12日 42 点赞 0 评论 524 浏览

Wonderland

Wonderland是一项由多伦多大学、Snap和UCLA联合开发的技术，能够基于单张图像生成高质量的3D场景，并支持精确的摄像轨迹控制。它结合了视频扩散模型和大规模3D重建模型，解决了传统3D重建技术中的视角失真问题，实现了高效的三维场景生成。Wonderland在多个基准数据集上的3D场景重建质量均优于现有方法，广泛应用于建筑设计、虚拟现实、影视特效、游戏开发等领域。

AI项目与工具 2025年06月12日 23 点赞 0 评论 935 浏览

RenderNet

RenderNet是一个基于AI技术的生成式平台，支持图像和视频创作，提供角色一致性控制、姿势调整、面部锁定等功能，适用于影视、游戏、广告及教育等多个领域。其开放API支持开发者构建定制化应用，提升内容创作效率与质量。

AI项目与工具 2025年06月12日 82 点赞 0 评论 641 浏览

Argil

Argil是一款基于SOTA深度学习技术的AI视频生成平台，支持快速创建个性化AI克隆形象，适用于品牌推广、教育、娱乐等多种场景。平台提供丰富的虚拟形象和灵活的视频编辑功能，如机位控制、肢体语言调整等，提升视频吸引力与真实性。无代码操作简化创作流程，支持多语言及多平台适配，适合个人创作者与企业使用。

AI项目与工具 2025年06月12日 37 点赞 0 评论 847 浏览

VideoAnydoor

VideoAnydoor是一款由多所高校与研究机构联合开发的视频对象插入系统，基于文本到视频的扩散模型，支持高保真对象插入与精确运动控制。其核心模块包括ID提取器和像素变形器，能实现对象的自然融合与细节保留。该工具适用于影视特效、虚拟试穿、虚拟旅游、教育等多个领域，具备良好的通用性和扩展性。

AI项目与工具 2025年06月12日 61 点赞 0 评论 726 浏览

LatentSync

LatentSync是由字节跳动与北京交通大学联合研发的端到端唇形同步框架，基于音频条件的潜在扩散模型，无需中间3D或2D表示，可生成高分辨率、动态逼真的唇同步视频。其核心技术包括Temporal Representation Alignment (TREPA)方法，提升视频时间一致性，并结合SyncNet监督机制确保唇部动作准确。适用于影视制作、教育、广告、远程会议及游戏开发等多个领域。

AI项目与工具 2025年06月12日 95 点赞 0 评论 906 浏览

Ingredients

Ingredients是一款基于多身份图像与视频扩散Transformer的视频生成框架，支持多身份特征的高效整合与动态分配。其核心模块包括面部提取器、多尺度投影器和ID路由器，能够保持身份一致性并生成高质量视频内容。无需额外训练即可实现个性化视频制作，适用于娱乐、广告、教育等多个领域。

AI项目与工具 2025年06月12日 49 点赞 0 评论 762 浏览

TransPixar

TransPixar是由多所高校及研究机构联合开发的开源文本到视频生成工具，基于扩散变换器（DiT）架构，支持生成包含透明度信息的RGBA视频。该技术通过alpha通道生成、LoRA微调和注意力机制优化，实现高质量、多样化的视频内容生成。适用于影视特效、广告制作、教育演示及虚拟现实等多个领域，为视觉内容创作提供高效解决方案。

AI项目与工具 2025年06月12日 17 点赞 0 评论 889 浏览

万相2.1

通义万相2.1是一款基于自研VAE和DiT架构的AI视频生成工具，支持高精度视频编解码与中文文字生成，具备复杂动作展现、物理规律还原、中英文特效生成及艺术风格转换等功能。同时支持图像生成，适用于影视制作、广告视频、教学辅助、文化创作等多个领域，提供高效的创作体验与高质量输出。

AI项目与工具 2025年06月12日 63 点赞 0 评论 851 浏览

视频生成

首页

视频生成

列表

默认

浏览次数

发布日期