Hallo2

简介：Hallo2是一款由复旦大学、百度公司和南京大学合作开发的音频驱动视频生成模型。它能够将单张图片与音频结合，并通过文本提示调节表情，生成高分辨率4K视频。Hallo2采用了补丁下降、高斯噪声等数据增强技术，提升了视频的视觉一致性和时间连贯性，同时通过语义文本标签提高了生成内容的可控性与多样性。该模型适用于电影、游戏、虚拟助手等多个领域，展现出强大的内容生成能力。

AI小编 568 阅读 0 评论 80 点赞

项目地址

Hallo2是由复旦大学、百度公司和南京大学联合研发的音频驱动视频生成模型。该模型能够将单张参考图片与数分钟的音频结合，并通过可选的文本提示调节表情，生成与音频同步的高分辨率4K视频。Hallo2采用先进的数据增强技术，例如补丁下降和高斯噪声，以提升视频的长期视觉一致性和时间连贯性。此外，该模型利用潜在代码的矢量量化与时间对齐技术，生成高质量的4K视频，并通过引入语义文本标签作为条件输入，增强生成内容的可控性和多样性。Hallo2已在多个公开数据集上进行了广泛测试，展示了其在长时间、高分辨率、多样化内容生成方面的强大能力。

本文分类：AI项目与工具
本文标签：音频驱动视频生成高分辨率文本提示数据增强时间对齐虚拟助手游戏开发新闻播报社交媒体
浏览次数：568 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/10936.html

评论列表共有 0 条评论

暂无评论

Hallo2

AniTalker

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复