语音

Offerin AI

一款基于GPT-4的AI面试笔试助手,支持实时语音识别、极速回答、精确搜索和代码生成等功能。

Offer蛙

Offer蛙是一款AI驱动的面试辅助工具,支持实时语音识别与答案生成,结合高频题库和简历信息,为用户提供专业级回答。具备代码题优化、多平台适配及隐私保护功能,适用于技术面试和线上面试场景,提升面试表现与专业形象。

Text

将文本转换成歌曲的工具。它使用自然语言处理将文本输入转换为音频组合。该工具允许用户从各种音乐风格和乐器中进行选择,以及调整节奏、键和动态等参数。生成的音轨可以导出为高...

创音岛

创音岛是一款集录音转文字、配音、AI写歌及音频编辑于一体的综合性音乐创作与音频处理平台。它采用先进语音识别技术,支持多场景下的文字转录需求;提供多样化的配音选项和智能化音乐编曲功能,帮助用户轻松创作音乐;并配备音频编辑工具,满足用户对音频文件的精细化处理需求。该平台界面友好,操作便捷,适合音乐爱好者、创作者及专业人士使用。

Fish Speech

Fish Speech是一款开源的文本到语音(TTS)工具,支持中文、英文和日文。它通过大约15万小时的多语种数据训练,实现了接近人类水平的语音合成效果。该工具的特点包括低显存需求(仅需4GB)、快速推理速度、高自定义性和灵活性。Fish Speech支持多种语音生成模型,如VITS2、Bert-VITS2等,适用于智能助手、自动客服、语言学习等多个领域。

Tactiq.io

一个为各种在线会议平台(例如 Google Meet、Zoom 和 MS Teams)提供实时转录服务的平台。Tactiq.io提供实时转录、人工智能生成的会议摘要、行动项目以及提出自定义问题的功能等功能。

FoloUp

FoloUp 是一款开源的 AI 语音面试平台,能根据职位描述自动生成面试问题,并通过自然语言交互与候选人进行语音面试。系统支持实时分析、评分与报告生成,提供数据仪表盘用于跟踪候选人表现。平台支持一键分享、远程面试和批量招聘,结合语音识别、NLP 和安全数据管理技术,适用于多种招聘场景,提升招聘效率与质量。

Blogcast™

BlogcastTM是一个文本转语音的工具,允许用户创建播客、视频、电子学习课程的音频和音频书籍,而无需录制。它由人工智能驱动的文本转语音技术提供支持,并提供多种声音和语言可供...

Scribenote

Scribenote是一款面向兽医的AI记录工具,利用自然语言处理技术将语音转换为结构化医疗笔记,支持SOAP格式、多宠物记录及客户沟通管理。它简化了文书工作,提高记录效率,适用于日常诊疗、手术记录、紧急处理及远程咨询等场景,同时兼容主流医疗信息系统。

SenseVoice

一款阿里通义实验室发布的FunAudioLLM框架多语言音频基础模型,SenseVoice具有多语种、混合语言、音色和情感控制能力。