硅语AI知识创业平台 硅语AI知识创业平台是一款基于人工智能技术的数字人解决方案,主要功能涵盖AI数字人克隆、语音合成、智能提词、字幕生成及美颜滤镜等。它支持多种应用场景,如教育、营销、内容创作和个人品牌建设,为用户提供便捷高效的数字人创建体验。 AI项目与工具 2025年06月12日 91 点赞 0 评论 275 浏览
Speech Speech-02 是 MiniMax 推出的先进文本到语音模型,支持零样本语音克隆和高质量语音合成,具备多语言支持和情感控制功能。采用自回归 Transformer 和 Flow-VAE 架构提升语音自然度和相似度,适用于配音、有声读物、智能助手等多种场景。提供 HD 和 Turbo 两个版本,满足不同性能需求。 AI项目与工具 2025年06月11日 33 点赞 0 评论 285 浏览
URO URO-Bench 是一个面向端到端语音对话模型的综合评估工具,支持多语言、多轮对话及副语言信息处理。它包含基础和高级两个赛道,分别涵盖16个和20个数据集,覆盖开放性问答、情感生成、多语言任务等。支持多种评估指标,提供简单易用的评估流程,并兼容多种语音对话模型。适用于智能家居、个人助理、语言学习等多个实际应用场景。 AI项目与工具 2025年06月12日 47 点赞 0 评论 287 浏览
MetaVoice Studio MetaVoice Studio允许用户录制自己的声音或上传文件来创建自定义语音剪辑。它提供了一个免费的计划,有6个声音,30秒的剪辑长度,和一个非商业许可。付费计划包括8个声音、10分钟... 创作工具 1970年01月01日 0 点赞 0 评论 292 浏览
MoonCast MoonCast 是一个零样本播客生成系统,能够从纯文本源合成自然的播客风格语音。它采用长上下文语言模型和大规模语音数据训练,支持中文和英文,生成几分钟长的高质量播客音频。MoonCast 通过特定的LLM提示生成播客脚本,并利用语音合成模块转换为最终音频,具备长音频生成、增强自然性、多语言支持和零样本语音合成等功能。其技术原理包括多阶段训练、短段级别自回归音频重建和自发性增强,适用于内容创作、教 AI项目与工具 2025年06月11日 63 点赞 0 评论 293 浏览
Audo Studio Audo AI为创作者和开发人员提供噪声消除产品,包括Audo Studio、Audo API和用于Linux的Magic Mic。这些产品利用音频处理和人工智能的最新进展,自动去除背景噪音,增强音频录制,... 创作工具 1970年01月01日 0 点赞 0 评论 295 浏览
VideoGen 一款能够在几秒钟内生成高质量、无版权的AI视频生成器。具有逼真AI声音的语音合成引擎、优化的视频编辑器和数百万商用免版税素材,为个人、企业和团队提供了一个快速、简单的视频制作体验。 Ai视频生成 2025年06月05日 29 点赞 0 评论 296 浏览