语音

URO

URO-Bench 是一个面向端到端语音对话模型的综合评估工具,支持多语言、多轮对话及副语言信息处理。它包含基础和高级两个赛道,分别涵盖16个和20个数据集,覆盖开放性问答、情感生成、多语言任务等。支持多种评估指标,提供简单易用的评估流程,并兼容多种语音对话模型。适用于智能家居、个人助理、语言学习等多个实际应用场景。

场辞

场辞,AI视频字幕制作软件,一款基于语音识别技术的视频字幕制作软件,一键智能识别字幕,提供语音转字幕、一键加字幕、视频加字幕,字幕快捷校对等功能,用AI加速你的创作。

Yoodli AI

Yoodli 是一款可让您录制您的演讲或演示文稿,并获得有关在沟通方面的分析,例如节奏、眼神交流、肢体语言、包容性语言、手势等。

微微在线二维码生成器

微微二维码是专业二维码制作服务商,提供视频音频二维码生成、图片文件二维码制作、二维码表单登记系统、二维码管理系统,广泛应用于:产品宣传、企业展示、旅游、教育培训、建筑...

Pemo

Pemo是一款AI驱动的文档管理工具,支持多格式文档导入与管理,提供智能翻译、摘要生成、思维导图、格式转换及语音朗读等功能。用户可自定义阅读模式并进行标注与笔记,提升阅读效率与知识整理能力,适用于学习、科研、办公及日常阅读等多种场景。

盘盘单词

盘盘单词是一款由百度网盘推出的AI英语学习微信小程序,它运用生成式AI技术分析用户照片,提取关键元素并生成相关英语单词和例句,帮助用户加深记忆。该程序提供了个性化学习路径、名人语音智能体和智能复习计划等功能,用户的学习资料存储在云端,不占用手机内存。盘盘单词适用于希望提高英语水平的各类用户,包括学生、职场人士、语言爱好者及备考人员。

Resemble AI

Resemble.ai的AI语音生成器是一个完整的生成式语音AI工具包,允许您在几秒钟内创建类似人类的声音。

Voxify

Voxify是一款利用AI技术将文本转化为自然语音的专业工具,具备超过450种声音选择,支持140多种语言和方言。用户可自定义音调、语速及情感表达,满足多样化的应用场景。此外,Voxify支持多格式输出并提供API接口,便于集成至其他系统中。

AudioBox

Audiobox 是 Meta 推出的 AI 语音和音效工具,结合语音输入和自然语言文字提示词生成语音和音效,例如输入提示词「一条流淌的河流和鸟儿在鸣叫」,Audiobox 自动生成音效。

PaddleSpeech

PaddleSpeech是百度飞桨团队开发的开源语音处理工具,涵盖语音识别、语音合成、声纹识别、语音翻译等功能。支持多种接口形式,适用于智能语音助手、语音播报、身份验证等场景。基于PaddlePaddle框架,提供高效的深度学习模型和丰富的音频处理能力,适用于多种实际应用需求。