数字

PersonaTalk

PersonaTalk是一种基于注意力机制的两阶段框架,用于实现高保真度和个性化的视觉配音。其核心技术包括风格感知音频编码、唇形同步几何生成、双注意力面部渲染等,能够确保视频中人物的嘴型动作与输入音频精准匹配,同时保留说话者的独特风格和面部特征。相比现有技术,PersonaTalk在视觉质量和唇形同步方面表现更优,适用于电影、游戏、虚拟助手等多个领域。

EchoMimic

EchoMimic是一款由阿里蚂蚁集团开发的AI数字人开源项目,通过深度学习模型结合音频和面部标志点,创造出高度逼真的动态肖像视频。该工具支持音频同步动画、面部特征融合、多模态学习和跨语言能力,适用于娱乐、教育和虚拟现实等领域。其独特的技术原理包括音频特征提取、面部标志点定位、面部动画生成和多模态学习,使用了卷积神经网络(CNN)、循环神经网络(RNN)和生成对抗网络(GAN)等深度学习模型,实现

多多群岛DuoDuoLand

多多群岛DuoDuoLand是面向年轻人最有影响力的的职场平台,打造未来AI驱动、强社交基因的Z世代人才网络和项目孵化韶。

HRAvatar

HRAvatar是由清华大学联合IDEA团队推出的单目视频重建技术,能够从普通单目视频中生成高质量、可重光照的3D头像。它采用可学习的形变基和线性蒙皮技术,结合精确的表情编码器和物理渲染模型,实现高精度重建和实时渲染(约155 FPS)。支持材质编辑、跨视角渲染和动画化,适用于数字人、虚拟主播、AR/VR、游戏开发和影视制作等领域。

Promptopia

Promptopia 是一款基于生成式 AI 技术的创作工具,专注于通过简单的文本提示生成游戏对象、环境和音乐等内容。它结合了多人游戏与实时 AI 资产生成功能,打破创作者与玩家之间的界限,支持用户自由构建沉浸式虚拟世界。此外,平台还提供 AI 微课程和提示库,助力用户提升创作能力。

MusicFX

Google MusicFX是一款基于人工智能技术的音乐生成工具,支持用户通过文本描述来生成音乐,涵盖多种风格。它具备文本到音乐创作、自定义音乐参数、数字水印技术和版权安全过滤等功能,旨在降低音乐创作门槛,提升创作效率和质量。自发布以来,已有大量用户通过该工具创作出原创音乐作品。

Keevx

Keevx是一款专注于AI数字人视频创作的工具,主要面向海外中小企业和个人创作者。它提供AI智能脚本生成、翻译功能,搭配优质公共人像和模板,支持一键生成营销视频。用户可上传自有脚本,选择数字人形象和语音来制作视频,适用于电商产品展示、员工培训、社交媒体内容创作及品牌宣传等场景。

RepText

RepText是一款由Shakker Labs与Liblib AI联合开发的多语言视觉文本渲染框架,采用字形模仿技术实现高质量文本生成。支持多种语言及复杂排版,具备精准控制、高效兼容和自然融合等特点,广泛应用于平面设计、艺术创作和数字内容生产等领域。

AI Chat

AI Chat-avatar 是一款基于AI的数字人交互工具,支持多语言实时翻译与自然对话,适用于销售、客服、培训等多种场景。它能动态展示多媒体内容,提升信息理解度,并提供数据分析报告以优化沟通策略。用户可通过低代码方式快速定制虚拟形象,满足不同业务需求。