Vidu Q1是由清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军教授团队研发的高可控视频生成模型。该模型支持生成1080p高清视频,画质细腻且细节丰富,可满足5秒视频的生成需求。在首尾帧功能优化后,用户仅需提供两张图片即可生成具有电影级自然运镜效果的视频。此外,Vidu Q1具备音效控制能力,可在时间轴上标注音效类型和时长,同步精度达±0.1秒。模型还支持通过上传参考图和文字指令,精准调整视频中主体的位置、大小及运动轨迹,并能对模糊区域进行局部超分重建,4K视频放大8倍仍保持清晰。 在国际评测榜单VBench-1.0和VBench-2.0中,Vidu Q1分别以87.41%和60.98%的成绩位列第一,超越了Runway、OpenAI Sora等主流模型。在国内SuperCLUE图生视频榜单中,Vidu Q1在动漫和写实风格中均取得双榜第一。其技术架构基于扩散模型与U-ViT结构,融合多模态信息,实现高质量、高一致性的视频生成。用户可通过API接入平台进行文生视频、图生视频等多种创作方式。
发表评论 取消回复