语音

创想家

专注于帮助独立视频制作和教程视频制作者高效管理视频制作流,随时随地规划视频内容,提升个体视频制作生产。

讯飞译制

讯飞译制是一款基于语音识别与机器翻译技术的智能字幕制作与翻译平台,支持多语言转换与自动字幕生成,提供高精度识别、智能时间码匹配、多格式导出及配音功能,适用于短视频出海、教学视频、广告宣传等多种场景,提升内容传播效率与国际化水平。

MiniMax Audio

MiniMax Audio是一款基于人工智能的语音合成工具,支持多语言、多情感及声音克隆功能,可将文本快速转换为自然流畅的语音。它具备降噪、超长文本合成、实时语音生成等特性,适用于视频配音、播客制作、游戏配音等多种应用场景。

Asyncflow v1.0

Asyncflow v1.0 是一款基于 AI 的文本转语音工具,支持超过 450 种语音选项,涵盖多种语言和风格。通过 Magic Dust AI 技术,实现快速语音克隆与高质量输出,降低训练成本。提供 API 接口,便于开发集成,适用于播客、广告、教育等多种场景,具备高效、易用和高性价比的特点。

Revid AI

Revid AI 是一款AI驱动的视频生成工具,支持从脚本创作到视频发布的全流程操作。用户可输入创意自动生成视频内容,涵盖多种风格与语言模板,具备简单易用的编辑功能及一键发布能力。适用于社交媒体、品牌营销、教育分享及电商展示等多个场景,提升内容创作效率与传播效果。

Alexa+

Alexa+是亚马逊推出的智能助手,基于生成式AI技术打造,支持自然语言交互与多任务处理。它能够连接智能家居设备、执行日常任务、提供个性化服务,并具备跨设备协同和主动提醒功能。适用于家庭控制、信息查询、娱乐管理等多个生活场景,为用户提供高效便捷的智能体验。

DupDub

DupDub是一款由出门问问开发的AI内容生成平台,集成了AI写作、文本转语音、视频编辑等多项功能,支持70多种语言和500多种真实语音效果。它通过简化创作流程,帮助内容创作者快速生成高质量的视频、文本和音频内容,适用于营销、教育、无障碍辅助等多种应用场景,有效提升工作效率与内容影响力。

Mahilo

Mahilo 是一款支持多智能体协作的框架,具备实时语音与文本通信能力,支持智能体间共享上下文并接受人类监督。其提供灵活的通信模式和策略管理功能,适用于客户服务、紧急响应、内容创作、医疗协调等多个场景。通过标准化的消息协议和可扩展的架构,Mahilo 提升了人机协作效率与决策质量。

灵伴科技Rokid

也和称Rokid,2014年成立,总部在杭州,创始人是前阿里巴巴M工作室负责人祝铭明,是一家专注于AI与AR技术的杭州高科技公司。

ChatTTS

ChatTTS是一个开源的专为对话场景设计的语音生成模型,特别适用于大语言模型(LLM)助手的对话任务,以及诸如对话式音频和视频介绍等应用。ChatTTS 不仅能说中文,英文也能 hold 住...