语音 - 智狐AI导航

Zeemo.ai

Zeemo，这是一款快速的 AI 字幕工具，可以为您的视频自动生成和翻译字幕。

字幕配音 2025年06月05日 97 点赞 0 评论 837 浏览

Aqua Voice

Aqua Voice 是一款AI驱动的语音转录与文档编辑工具，支持语音转文字、自然语言指令编辑、自动格式优化及多语言处理。它适用于高效写作、辅助输入及跨平台办公场景，兼容多种主流应用，提升文本创作效率与准确性。

AI项目与工具 2025年06月11日 81 点赞 0 评论 837 浏览

MarkItDown

MarkItDown是一款由微软推出的开源文档转换工具，支持多种文件格式（如PDF、Office文档、图像、音频等）转换为Markdown格式。它具备OCR文字识别、语音转文字、元数据提取等功能，适用于文档归档、内容发布、数据挖掘、学术研究等多个场景，旨在简化文件处理流程，提升工作效率。通过提供简单易用的API接口，MarkItDown成为开发者友好型工具。

AI项目与工具 2025年06月12日 22 点赞 0 评论 838 浏览

Bark

Bark是一款开源的文本到音频转换模型，由Suno AI开发，能够生成逼真的多语言语音及多种音频类型，包括音乐和背景噪音，并支持非语言交流的声音。该模型提供预训练模型，适用于研究和商业用途。其主要功能涵盖文本到音频转换、多语言支持、音频多样性和非语言交流模拟。Bark在多语言内容创作、音频内容生成和非语言交流场景中具有广泛应用。

AI项目与工具 2025年06月12日 28 点赞 0 评论 839 浏览

moemate

Moemate是一款集成了多语言对话、屏幕感知、语音克隆和自定义图像模型等功能的AI角色平台。它支持用户创建个性化AI伴侣，并兼容多种语言模型和操作系统。Moemate不仅提供娱乐体验，还具备教育辅助、信息查询和工作效率提升等实用功能，适合个人和企业用户。

AI项目与工具 2025年06月12日 88 点赞 0 评论 841 浏览

Oliva

Oliva 是一款基于语音驱动的 RAG 助手，结合 Langchain 和 Qdrant 向量数据库，实现语音指令到结构化数据的实时响应。支持多智能体协作、语义搜索与灵活知识库集成，适用于企业知识库、智能客服、智能家居等多种场景。具备语音识别、实时通信和自然语言处理能力，提升信息获取与交互效率。

AI项目与工具 2025年06月12日 57 点赞 0 评论 842 浏览

TIGER

TIGER是由清华大学研发的轻量级语音分离模型，采用时频交叉建模策略与多尺度注意力机制，有效提升语音分离性能，同时显著降低计算和参数开销。模型通过频带切分优化资源利用，适应复杂声学环境，广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。

AI项目与工具 2025年06月12日 98 点赞 0 评论 842 浏览

CircleBack

CircleBack 是一款基于 AI 的会议记录工具，支持多语言转录与智能总结，能自动生成结构化笔记和行动项。其具备强大的口音识别能力，可与 Zoom、Google Meet、Microsoft Teams 等平台集成，适用于企业会议、远程协作、教育、客户服务及医疗等多个场景。此外，它还支持语义搜索和工作流自动化，提升会议管理效率。

AI项目与工具 2025年06月11日 29 点赞 0 评论 843 浏览

Imagine Explainers

Imagine Explainers 是一款基于 AI 的视频生成工具，支持用户根据主题和时长快速生成高质量动画视频。提供多种模板、角色和风格选择，支持 AI 语音或自定义音频。适用于教育、商业、营销等多个领域，能够将复杂内容转化为直观的视觉表达，提升信息传达效率。

AI项目与工具 2025年06月11日 85 点赞 0 评论 843 浏览

MUSIC.AI

MUSIC.AI 是一款基于人工智能的音频处理平台，提供音频分离、混音、母带处理、语音转换、歌词转录等功能，支持多语言翻译与本地化。平台已处理超 10 亿分钟音频，服务数千万用户，适用于音乐制作、视频剪辑及现场演出等多种场景，显著提升音频处理效率与质量。

AI项目与工具 2025年06月12日 93 点赞 0 评论 844 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期