ConsisID

简介：ConsisID是一款由北京大学和鹏城实验室开发的文本到视频生成工具，其核心技术在于通过频率分解保持视频中人物身份的一致性。该模型具备高质量视频生成能力、无需微调的特点以及强大的可编辑性，同时拥有优秀的泛化性能。其主要功能包括身份保持、高质量视频生成、文本驱动编辑以及跨领域人物处理，广泛应用于个性化娱乐、虚拟主播、影视制作、游戏开发及教育模拟等领域。

AI小编 639 阅读 0 评论 18 点赞

项目地址

ConsisID是由北京大学与鹏城实验室联合研发的文本到视频生成模型（Text-to-Video, IPT2V），通过频率分解技术确保视频中人物身份的高度一致性。该模型采用免调优的Diffusion Transformer（DiT）架构，结合低频全局特征与高频内在特征，利用分层训练策略生成高质量、可编辑且身份一致性强的视频内容。ConsisID在多个评估维度上表现优异，显著提升了身份一致性视频生成技术的水平。

本文分类：AI项目与工具
本文标签：文本到视频身份一致性 Diffusion Transformer 频率分解可编辑视频免调优 Transformer架构视频生成跨领域泛化文本驱动编辑
浏览次数：639 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/10007.html

评论列表共有 0 条评论

暂无评论

ConsisID

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复