Vidu Q1

简介：Vidu Q1是清华大学朱军教授团队研发的高可控视频生成模型，支持1080p高清视频生成，具备精准音效控制、多主体一致性调节、局部超分重建等功能。在多项国际评测中表现优异，包括VBench和SuperCLUE榜单均获第一。模型基于扩散模型与U-ViT架构，融合文本、图像和视频信息，适用于影视制作、广告宣传及动画创作等领域。

AI小编 655 阅读 0 评论 96 点赞

官网地址

Vidu Q1是由清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军教授团队研发的高可控视频生成模型。该模型支持生成1080p高清视频，画质细腻且细节丰富，可满足5秒视频的生成需求。在首尾帧功能优化后，用户仅需提供两张图片即可生成具有电影级自然运镜效果的视频。此外，Vidu Q1具备音效控制能力，可在时间轴上标注音效类型和时长，同步精度达±0.1秒。模型还支持通过上传参考图和文字指令，精准调整视频中主体的位置、大小及运动轨迹，并能对模糊区域进行局部超分重建，4K视频放大8倍仍保持清晰。在国际评测榜单VBench-1.0和VBench-2.0中，Vidu Q1分别以87.41%和60.98%的成绩位列第一，超越了Runway、OpenAI Sora等主流模型。在国内SuperCLUE图生视频榜单中，Vidu Q1在动漫和写实风格中均取得双榜第一。其技术架构基于扩散模型与U-ViT结构，融合多模态信息，实现高质量、高一致性的视频生成。用户可通过API接入平台进行文生视频、图生视频等多种创作方式。

本文分类：AI项目与工具
本文标签：AI视频生成高清视频音效控制多模态融合视频质量控制性 AI工具 Vidu Q1 视频生成模型超分重建
浏览次数：655 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/8320.html

评论列表共有 0 条评论

暂无评论

Vidu Q1

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复