语音合成
TTS Online
TTS Online是一款免费的文本转语音工具,提供语音合成服务,支持多种语言,包括英语、法语、德语、西班牙语、阿拉伯语、中文、日语、韩语等,以及多种语音风格。
VoxInstruct
VoxInstruct是清华大学开源的语音合成技术,能够根据人类语言指令生成高质量的语音。该系统采用统一的多语言编解码器语言建模框架,将传统的文本到语音任务扩展到了更广泛的人类指令到语音任务。VoxInstruct通过引入语音语义标记和多种无分类器指导策略,提升了语音合成的自然度和表现力。它支持多语言和跨语言合成,适用于智能语音助手、有声读物、教育培训等多个领域。
MiniMax MCP Server
MiniMax MCP Server 是一款基于 MCP 协议的多模态生成服务器,支持视频、图像、语音及声音克隆等功能。其具备高分辨率输出、自然语音生成与声音克隆能力,兼容多种主流客户端。平台采用客户端-服务器架构,结合 RAG 技术提升响应准确性,适用于教学、游戏开发、内容创作等多个领域。
AutoShorts
AutoShorts是一个开源的AI视频创作和发布平台,它通过AI技术自动生成并定制视频内容,支持用户自定义脚本、配音和视觉效果。该平台可实现每日自动发布新视频到YouTube和TikTok,适用于内容创作者、社交媒体管理者、营销代理及教育机构。AutoShorts简化视频制作流程,提升工作效率,同时确保内容的独特性和创新性。