语音
Enhance Speech
一款由 Adobe 出品的录音增强工具,可以去除音频背景噪音,让语音或者录音听起来就像在专业录音室中录制一样,使音频具有专业录音室品质录音的干净、专业的声音。
声动视界SoundView
一款面向带货短视频的AI视频工具,声动视界SoundView提供视频翻译、文本转语音和视频配音等功能。
日日新SenseNova V6
日日新SenseNova V6是商汤科技推出的第六代多模态大模型,基于6000亿参数架构,支持文本、图像、视频的原生融合。具备强推理、长记忆与情感表达能力,适用于视频分析、教育辅导、智能客服、具身智能等多个领域,提升交互体验与内容处理效率。
问小白上线DeepSeek
“问小白”平台提供免费且无限使用的DeepSeek R1满血版服务,支持联网搜索、文件上传、多模态处理等功能,运行流畅稳定。平台在多项实测中表现优异,具备深度思考能力、智能追问及语音交互功能,适用于多种场景,用户体验良好,且完全免费。
FireRedASR
FireRedASR是小红书推出的工业级自动语音识别(ASR)模型系列,支持普通话、中文方言和英语,具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本,分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色,且已开源,推动语音识别技术的发展。
TTS-Voice-Wizard
TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100...
