语音 - 智狐AI导航

Klic Studio

Klic Studio是一款基于大型语言模型的视频翻译与配音工具，支持56种语言翻译，适用于多平台内容制作。具备高精度字幕识别、智能分割对齐、语音克隆及一键视频合成等功能，简化视频创作流程，提升多语言内容传播效率。

AI项目与工具 2025年06月12日 76 点赞 0 评论 803 浏览

Miley AI

Miley AI 是一款基于人工智能的生活助手，主要功能包括智能语音记录、情绪识别、自动记账、日程管理以及与苹果健康数据连接的运动监督。这款工具特别适用于忙碌的职场人士、创意工作者、学生、健身爱好者及理财者，帮助他们更高效地管理日常生活和工作任务。

AI项目与工具 2025年06月12日 42 点赞 0 评论 803 浏览

WeClone

WeClone是一款基于聊天记录创建数字分身的AI工具，通过微调大语言模型生成个性化风格的数字分身，并支持绑定到微信、QQ、Telegram等平台。它提供聊天记录预处理、语音克隆、隐私保护和本地化部署等功能，确保数据安全。用户可灵活配置模型，应用于个人助理、内容创作、情感陪伴等多个场景。

AI项目与工具 2025年06月11日 38 点赞 0 评论 805 浏览

Voila

Voila是一款开源的端到端语音大模型，支持实时语音交互与多轮对话，具备高保真、低延迟的音频处理能力。集成语音与语言建模功能，支持百万级预设声音及个性化定制，适用于语音助手、角色扮演、语音翻译等场景。采用多尺度Transformer架构，提升语音理解与生成质量，降低开发成本，提高通用性与灵活性。

AI项目与工具 2025年06月11日 60 点赞 0 评论 806 浏览

紫东太初 – 多模态大模型

“紫东太初”平台展现了中国科学院自动化研究所在人工智能领域的深厚实力。它不仅具备强大的多模态处理能力，还通过自监督学习和跨模态语义关联技术，为广泛的AI应用提供了坚实的模...

Ai平台模型 2026年06月10日 0 点赞 0 评论 808 浏览

Multi

Multi-Speaker 是 AudioShake 推出的高分辨率多说话人分离工具，支持将音频中不同说话人的语音精准分离至独立轨道，适用于广播级音频处理。它具备高保真音频处理能力，支持高采样率，能处理长达数小时的录音，在复杂场景下仍能保持稳定效果。广泛应用于影视、播客、无障碍服务及内容创作等领域，提升音频编辑效率与质量。

AI项目与工具 2025年06月12日 55 点赞 0 评论 808 浏览

Ultravox

Ultravox 是一种多模态大型语言模型（LLM），能够直接处理文本和语音输入，无需额外的语音识别步骤。其核心技术包括多模态投影器，用于将音频数据转换为高维空间表示，显著提升语音理解和处理效率。该模型支持实时语音对话、多语言扩展及领域特定知识的学习，适用于智能客服、虚拟助手、语言学习、实时翻译及教育等领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 810 浏览

鸭鸭配音

一个在线配音网站，是目前为数不多的免费的在线文字转语音的配音神器，用户只需输入文本，即可生成高度拟人的智能配音。

字幕配音 2025年06月05日 80 点赞 0 评论 812 浏览

Perplexity macOS客户端

Perplexity macOS 是一款基于人工智能技术的搜索工具，集成了大语言模型，支持实时联网搜索、多源内容整合及信息来源标注。其主要功能包括语音与文本输入、线索跟踪、历史记录查看及文件分析等，适用于深度研究、信息查询、知识管理和文件分析等多种应用场景，旨在提高用户的搜索效率和工作生产力。

AI项目与工具 2025年06月12日 17 点赞 0 评论 813 浏览

Martin

Martin是一款由大学生团队开发的人工智能助手，支持语音交互与多平台通信，具备日程管理、邮件处理、任务跟踪、文件管理等功能。它通过自定义记忆架构理解用户偏好，提供个性化服务，适用于日常办公和生活管理，提升工作效率与便利性。

AI项目与工具 2025年06月12日 25 点赞 0 评论 813 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期