语音

SeniorTalk

SeniorTalk是全球首个面向中文超高龄老年人的语音数据集,涵盖202位75岁以上老人的55.53小时语音数据,覆盖16个省市,包含多种口音。数据通过两两自发对话采集,内容贴近真实交流场景,并附有多维标注,如说话人信息、时间戳、口音分类等。该数据集可用于语音识别、说话人验证、语音编辑等研究,支持适老化设备、健康管理和辅助养老系统的开发,推动相关技术进步。

Hibiki

Hibiki是一款由Kyutai Labs开发的开源语音翻译解码器,支持实时语音到语音(S2ST)和语音到文本(S2TT)的翻译。其基于多流语言模型架构,结合弱监督学习和上下文对齐技术,实现低延迟、高保真度的翻译效果。适用于国际会议、在线教育、旅游、新闻采访及客户服务等场景,具备良好的实用性和可扩展性。

Alexa+

Alexa+是亚马逊推出的智能助手,基于生成式AI技术打造,支持自然语言交互与多任务处理。它能够连接智能家居设备、执行日常任务、提供个性化服务,并具备跨设备协同和主动提醒功能。适用于家庭控制、信息查询、娱乐管理等多个生活场景,为用户提供高效便捷的智能体验。

Mahilo

Mahilo 是一款支持多智能体协作的框架,具备实时语音与文本通信能力,支持智能体间共享上下文并接受人类监督。其提供灵活的通信模式和策略管理功能,适用于客户服务、紧急响应、内容创作、医疗协调等多个场景。通过标准化的消息协议和可扩展的架构,Mahilo 提升了人机协作效率与决策质量。

OfferinAI

OfferinAI是一款面向求职者和招聘者的智能工具,集成了实时语音识别、快速响应、网络搜索及代码生成等功能,旨在提升用户在面试和笔试中的表现。它支持多种模式,适用于在线面试、笔试辅助、技能测试及模拟面试等场景,帮助用户在多轮面试中获得竞争优势。

出门问问

出门问问,一家以生成式AI与语音交互为核心的人工智能公司。

MiniMax Audio

MiniMax Audio是一款基于人工智能的语音合成工具,支持多语言、多情感及声音克隆功能,可将文本快速转换为自然流畅的语音。它具备降噪、超长文本合成、实时语音生成等特性,适用于视频配音、播客制作、游戏配音等多种应用场景。

VXlive

VXlive是一款以语音社交为核心的多功能应用,支持语音聊天、直播、1对1视频通话及AI互动功能。内置AI语音识别与语音日记,提供个性化互动体验,增强用户情感陪伴。语音挑战活动提升社交趣味性,适合各类用户拓展社交圈,尤其适合社交焦虑人群。应用注重互动性和社区氛围,打造轻松友好的社交环境。

Noiz AI

Noiz AI 是一款基于自研大模型的 AI 语音合成与克隆工具,支持 3-10 秒音频快速生成逼真语音模型,适用于 TTS、视频配音和多语言翻译。具备情感化语音输出与一键语言转换功能,广泛应用于内容创作、教育、商业及娱乐等领域,提升内容表达效果与国际化传播能力。

摩笔天书

摩笔天书是一款由摩尔线程研发的AI辅助绘本创作工具,它结合了故事生成、图像生成、语音合成及音乐创作等多种AI技术,为用户提供从文字到完整绘本的全流程自动化创作服务。用户可轻松调整生成内容,满足个性化需求。该工具以其卓越的图文一致性、易读性及自动生成的音乐和旁白,成为无设计经验者快速产出高质量绘本的理想选择。