MagicAvatar

介绍：MagicAvatar由字节跳动开发，是一款主打多模态输入生成的多模态框架，可以将文本、视频和音频等不同输入方式转化为动作信号，从而生成和动画化一个虚拟人物。

897 阅读 0 评论 31 点赞

前往官网

MagicEdit是字节跳动推出的视频剪辑方法，这是一个多模态框架，能够将文本、视频和音频等多种输入方式转化为动作信号，从而生成并动画化虚拟人物。

具体来说，MagicAvatar可以通过文本提示创建虚拟人物，也能根据源视频生成跟随指定动作的虚拟形象。此外，它还能对特定主题的虚拟人物进行动画处理，未来还将支持通过音频输入创建虚拟人物。

与传统视频生成方式不同，MagicAvatar将视频生成分为两个明确阶段：

（1）多模态信息到动作

（2）动作到视频

第一阶段将多模态输入转换为动作信息（如人体姿势、深度等），第二阶段则根据这些动作信号生成视频。

MagicAvatar只需提供几张目标人物的图像就能生成视频。它支持多种应用场景，包括文本引导、视频引导的虚拟形象生成，以及多模态形象动画。

MagicEdit还支持多种编辑功能，包括视频风格化、局部编辑、视频混合（Video-MagicMix）等。视频风格化可以将源视频转换为特定风格，创造不同主题和背景的新场景，如现实或卡通风格。

MagicEdit是一款强大的文生视频编辑工具。用户只需使用自然语言提示，就能轻松改变视频风格、场景，甚至替换对象或添加元素，同时保持原视频的动作和外观。此外，其视频混合功能还能创造出全新概念。

MagicAvatar还支持用户上传目标人物图片，为特定人物生成动画，满足个性化需求。

字节跳动的AI视频项目MagicAvatar和MagicEdit，展现了在多模态输入和视频编辑领域的巨大潜力。

暂无评论