语音

Dubbingx

全球唯一、多情绪、多语态、全可控的AI配音产品

妙话AI

一个在线智能写作应用,妙话AI提供了包括自动生成绘画、语音对话机器人等多种功能。它集成了100多个智能AI大模型,用户可以通过一键操作进行聊天、写作、绘画和语音生成,轻松解决复杂问题。

ShowBiz AI

ShowBiz AI是一款基于BlackEye多模态视听大模型的专业级AI视频创作平台,专注于文本转动画、全流程AI赋能以及多种视频编辑功能。它支持从文案生成到分镜脚本设计再到编辑工具的一站式服务,涵盖横屏转竖屏、慢动作生成、抠像、扩图、擦除、高光处理、语音转写及语音生成等功能,旨在提升视频制作效率并降低创作成本,同时激发创意灵感。

TEN VAD

TEN VAD是一款高性能的实时语音活动检测系统,专为企业级应用设计。它基于深度学习技术,能够精确区分语音和非语音信号,具有低延迟、轻量级和高精度的特点。支持多种平台和编程接口,适用于智能助手、客服机器人等场景,帮助构建更高效、更智能的对话系统。

Soundverse AI

一个利用生成式人工智能的音乐创作平台,Soundverse AI提供免费的 AI 音乐生成器和语音助手,帮助音乐创作者轻松制作高质量的音乐。

MoneyPrinterPlus

MoneyPrinterPlus是一款基于AI技术的短视频生成工具,能够实现一键批量生成并自动混剪短视频。该工具支持将视频自动发布至多个社交平台,简化了视频内容创作流程。MoneyPrinterPlus的核心功能包括AI一键批量生成短视频、自动批量混剪、自动发布到社交平台、支持本地和云语音服务以及AI生图功能。

Skyo

Skyo是一款基于天工AI大模型技术的智能语音对话助手,具备快速响应、多语言对话、实时打断、情感化回应及个性化记忆等功能。它能根据用户情绪提供拟人化回复,并支持长时间对话和个性化声音定制。Skyo可应用于情感陪伴、个性化交互、多语言客服、时事新闻聊天、教育辅助和生活助理等多个场景,旨在为用户提供高质量的互动体验。

Moonshine

Moonshine是一款专为资源受限设备设计的高效语音识别模型,支持实时语音转文本,具有低延迟、高准确率的特点。它基于编码器-解码器架构和旋转位置嵌入技术,适应不同长度的音频输入,计算需求随音频长度变化而调整,适合边缘设备部署。主要应用于会议转录、语音助手、听力辅助及多语言翻译等领域。

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目,包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识,支持超过50种语言;CosyVoice则专注于自然语音生成,支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景,其相关模型和代码已公开发布。

Offer蛙

Offer蛙是一款AI驱动的面试辅助工具,支持实时语音识别与答案生成,结合高频题库和简历信息,为用户提供专业级回答。具备代码题优化、多平台适配及隐私保护功能,适用于技术面试和线上面试场景,提升面试表现与专业形象。