虚拟主播

Spark

Spark-TTS是一款基于大型语言模型的高效文本转语音工具,支持中英文双语及跨语言合成。它无需额外生成模型,通过LLM预测编码直接生成音频,实现零样本语音克隆。用户可自定义语音参数,如音色、语速等,适用于语音助手、多语言内容创作、智能客服及虚拟角色配音等多种场景。

JoyGen

JoyGen是由京东科技与香港大学联合开发的音频驱动型3D说话人脸视频生成框架,能够实现唇部动作与音频信号的精准同步,并提供高质量的视觉效果。该工具采用单步UNet架构进行高效视频编辑,基于130小时中文视频数据集训练,在唇音同步和视觉质量方面表现优异。适用于虚拟主播、动画制作、在线教育及多语言视频生成等多个领域,为视频内容创作提供了创新解决方案。

Yodayo AI | 文本生成动漫图片

Yodayo是一个AI文本生成动漫图片工具,是一款先进的人工智能系统,它可以根据你输入的文字或图片,自动生成出免费、高质量的动漫风格的画面。

全响AI

一个支持专有知识库投喂和训练的系统,i-Avatar数字人平台能够根据用户的不同需求定制企业或个人的数字人员工。

讯飞数字人

科大讯飞推出的一款基于AI技术的一站式数字人音视频内容生产工具,具有在虚拟“AI演播室”中输入文本或录音,一键完成音、视频作品的输出,3分钟内渲染出稿。包括形象克隆、声音复刻、3D定制、内容生产、虚拟直播、能力接入等功能。