语音合成

首页

语音合成

列表

默认

浏览次数

发布日期

Sonic

Sonic

Sonic是由腾讯与浙江大学联合开发的音频驱动肖像动画框架，基于音频信号生成逼真面部表情和动作。它通过上下文增强音频学习和运动解耦控制器，提升唇部同步精度与运动多样性。Sonic在长视频生成中表现出色，具备高稳定性与自然连贯性，支持用户自定义参数。适用于虚拟现实、影视制作、在线教育、游戏开发和社交媒体等多个领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 822 浏览

绘声美音

绘声美音

绘声美音是一款集声音克隆、AI变声、文字转语音及多种音频处理功能于一体的在线工具，用户可通过微信公众号便捷使用。支持上传语音训练专属声纹模型，进行歌曲翻唱并生成MV，同时提供变声、音频提取、听歌识曲等功能，适用于娱乐、配音、创作等多种场景。

AI项目与工具 2025年06月12日 39 点赞 0 评论 739 浏览

SpeechGPT 2.0

SpeechGPT 2.0

SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队开发的拟人化实时交互系统，基于大量中文语音数据训练，支持低延迟、高自然度的语音与文本交互。具备情感控制、实时打断、多风格语音生成等功能，适用于智能助手、内容创作及无障碍通信等场景，技术上融合了语音-文本联合建模与多阶段训练策略，提升语音表现力与智能化水平。

AI项目与工具 2025年06月12日 23 点赞 0 评论 634 浏览

FilmAgent

FilmAgent

FilmAgent是一款由哈尔滨工业大学（深圳）研发的虚拟电影制作工具，基于多智能体协作框架，实现从剧本创作到镜头拍摄的全流程自动化。支持剧本生成、多智能体协作、镜头规划、语音合成等功能，适用于创意视频制作、影视教学及虚拟场景应用。系统在Unity 3D环境中运行，提升电影制作效率与创意表达能力。

AI项目与工具 2025年06月12日 31 点赞 0 评论 730 浏览

Jellypod

Jellypod

Jellypod 是一款基于 AI 的播客制作工具，支持从网页、PDF 等多种格式自动生成脚本并转为音频，涵盖 30 多种语言和口音。用户可自定义 AI 主持人，编辑脚本并一键发布到主流平台，具备高质量音频生成与内容管理功能，适用于企业、教育和个人品牌建设等场景。

AI项目与工具 2025年06月12日 80 点赞 0 评论 641 浏览

百聆

百聆是一款开源语音对话系统，融合语音识别、语音活动检测、大语言模型和语音合成技术，实现自然流畅的语音交互。支持低延迟运行，无需GPU，适用于边缘设备。具备记忆、工具调用和任务管理等功能，适用于智能家居、个人助理、车载系统等多种场景，提供高效的语音交互解决方案。

AI项目与工具 2025年06月12日 90 点赞 0 评论 606 浏览

T2A

T2A

T2A-01-HD是一款支持声音克隆与多语言合成的AI语音模型，可精准还原原声特征与情感表达。具备智能情感系统、多语言支持及高级参数控制功能，适用于有声读物、影视配音、教育、语言学习等多种场景，提供高质量、个性化的语音输出。

AI项目与工具 2025年06月12日 46 点赞 0 评论 499 浏览

Kokoro

Kokoro

Kokoro-TTS是一款由hexgrad开发的轻量级文本转语音工具，基于StyleTTS 2与ISTFTNet架构，支持多种语音风格和自然语调，具备实时处理能力。支持美式与英式英语，提供10种语音包，适用于教育、游戏、客服等多种场景。支持本地部署与API集成，确保数据安全与高效运行。

AI项目与工具 2025年06月12日 33 点赞 0 评论 946 浏览

星火语音同传大模型

星火语音同传大模型

星火语音同传大模型是科大讯飞推出的国内首个端到端语音同传AI系统，支持37种语言，具备高精度翻译、流式处理、语境理解和语音合成优化等功能。模型可在5秒内完成同传，准确度高，适用于国际会议、商务交流、教育等场景，支持译文长度调节和设备兼容，提升跨语言沟通效率。

AI项目与工具 2025年06月12日 53 点赞 0 评论 922 浏览

Fineshare VoiceTrans

Fineshare VoiceTrans

Fineshare VoiceTrans 是一款支持实时变声的 AI 工具，可将声音转换为多种角色或性别，保留原有情感与语调。提供丰富的音效库、声音实验室和预设声音包，适用于游戏、直播、配音等场景。用户可通过不同订阅计划获得无限使用权限和定制服务，提升创作与互动体验。

AI项目与工具 2025年06月12日 24 点赞 0 评论 863 浏览

微信公众账号

微信扫一扫加关注