音频

海豚配音TTS Online

海豚配音TTS Online是一个多功能的在线TTS服务平台,它通过先进的语音合成技术,为用户提供了一种便捷的方式来生成高质量的语音内容。

ListenHub

ListenHub 是一款基于 AI 技术的播客生成工具,支持中英文内容处理,可快速生成高质量播客。它能自动生成主题、脚本,并提供超真实人声体验。用户可自定义角色、编辑音频并一键发布至多个平台,适用于个人创作、知识分享和娱乐休闲等多种场景。

Mubert

人类×人工智能生成音乐,对于您的视频内容、播客和应用程序

boomy

创建生成音乐,与世界分享.

Particle News

Particle News是一款以AI驱动的新闻阅读平台,通过聚合多源信息,为用户提供个性化、简洁的新闻摘要与多视角报道。其核心功能包括个性化订阅、多样化新闻风格展示、互动问答及音频新闻服务,旨在帮助用户高效获取全面、客观的信息。适用于通勤、学习、工作等多种场景,适合各类用户群体。

BuboGPT | 字节大模型

BuboGPT是由字节跳动开发的大型语言模型,能够处理多模态输入,包括文本、图像和音频,并具有将其响应与视觉对象相对应的独特能力。

Cover AI

一款专业的AI封面生成工具,支持免费生成小红书封面、公众号封面、小说封面、红包封面、视频封面等多种类型的封面。

歌歌AI

歌歌AI写歌 是一个旨在让每个人都能成为音乐家的平台,它通过人工智能技术,提供了一种创新的方式来创作音乐。

EDTalk

EDTalk是一款基于音频驱动的唇部同步模型,支持嘴型、头部姿态及情感表情的独立操控。用户可通过上传图片、音频和参考视频生成具有唇形同步和情感表达的动态人脸视频,广泛应用于教育、影视后期、虚拟现实等领域。其高效解耦机制和轻量化设计使其易于操作且资源友好。

EMO2

EMO2是一种由阿里巴巴智能计算研究院开发的音频驱动头像视频生成技术,通过音频输入和静态人像照片生成高质量、富有表现力的动态视频。其核心技术包括音频与手部动作的协同建模、扩散模型生成视频帧,以及高精度音频同步。该工具支持多样化动作生成,适用于虚拟现实、动画制作和跨语言内容创作等场景,具备自然流畅的视觉效果和丰富的应用场景。