虚拟

FantasyID

FantasyID是由阿里巴巴集团与北京邮电大学联合开发的视频生成框架,基于扩散变换器和3D面部几何先验,实现高质量、身份一致的视频生成。其通过多视角增强和分层特征注入技术,提升面部动态表现,同时保持身份稳定性。支持多种应用场景,如虚拟形象、内容创作和数字人交互,具备无需微调的高效生成能力。

aoGen

aoGen 是一款面向电商行业的 AI 图像生成工具,可快速生成多种风格的虚拟模特并实现服装适配,提供虚拟试衣功能以提升购物体验。其图像增强与编辑功能包括智能修复和物体移除,还可将静态图片转为动态视频,支持多场景应用,有效降低拍摄成本并提升视觉吸引力。

Aidge

Aidge是阿里巴巴国际数字商业集团推出的AI电商运营平台,集成了翻译、虚拟模特生成和图像处理等功能,旨在提升跨境电商效率与用户体验。平台提供API接口,支持多语言开发,适用于多种电商场景,如产品推广、客服支持和本地化营销,助力商家降低成本、提高转化率。

Umax

Umax是一款基于AI的面部分析工具,通过上传自拍照提供颜值评分、面部特征分析及个性化改进建议。具备进度跟踪、虚拟化妆、滤镜等功能,帮助用户提升外貌与自信。适用于日常美容、自我提升及美学学习,适合关注形象管理的用户。

Stable Video 3D (SV3D)

Stable Video 3D(SV3D)是一款由Stability AI公司开发的多视角合成和3D生成模型,能够从单张图片生成一致的多视角图像,并进一步优化生成高质量的3D网格模型。该模型在视频扩散模型基础上进行改进,提供更好的质量和多视角体验。主要功能包括多视角视频生成、3D网格创建、轨道视频生成、相机路径控制以及新视角合成。SV3D在新视角合成方面取得显著进展,能够生成逼真且一致的视图,提升

代号M9

代号M9支持虚拟形象装扮、多人群聊、好友地图、实时状态、个性咕卡等新奇功能,是一款集社交、游戏、娱乐于一体的虚拟交友模拟游戏。

INFP

INFP是一款基于音频驱动的头部生成框架,专为双人对话设计,具备自动角色转换功能。它通过两个阶段实现头部生成:基于动作的头部模仿和音频引导的动作生成。同时,INFP提出了大规模双人对话数据集DyConv,推动了相关领域的研究进展。该工具适用于视频会议、虚拟助手、教育培训、客户服务等多个场景,支持实时互动并可调节生成风格。

Audio2Photoreal

从音频生成全身逼真的虚拟人物形象。它可以从多人对话中语音中生成与对话相对应的逼真面部表情、完整身体和手势动作。

Loopy AI

字节跳动和浙江大学联合开发的音频驱动的AI视频生成模型,能够将静态图像转化为动态视频,实现音频与面部表情、头部动作的完美同步。

Matryoshka Diffusion Models

Matryoshka Diffusion Models (MDM) 是一种由苹果公司开发的创新扩散模型,专为生成高分辨率图像和视频而设计。通过多尺度扩散机制与NestedUNet架构,MDM实现了高效的信息共享与渐进式训练,显著提升了模型的训练效率与生成质量。该模型适用于资源受限的环境,可减少训练步骤并保持生成图像的细节与清晰度。其主要功能包括高分辨率图像生成、多分辨率处理、特征共享以及渐进式训练