语音 - 智狐AI导航

Asyncflow v1.0

Asyncflow v1.0 是一款基于 AI 的文本转语音工具，支持超过 450 种语音选项，涵盖多种语言和风格。通过 Magic Dust AI 技术，实现快速语音克隆与高质量输出，降低训练成本。提供 API 接口，便于开发集成，适用于播客、广告、教育等多种场景，具备高效、易用和高性价比的特点。

AI项目与工具 2025年06月12日 72 点赞 0 评论 644 浏览

PodAgent

PodAgent是一款由多所高校与企业联合开发的播客生成框架，采用多智能体协作机制，模拟真实脱口秀场景，自动生成高质量对话内容。系统具备声音匹配、语音合成与表现力增强功能，并提供多语言支持和完整播客结构生成能力。同时，PodAgent引入评估指标，确保内容的专业性与多样性，适用于媒体、教育、企业推广等多个领域。

AI项目与工具 2025年06月12日 87 点赞 0 评论 696 浏览

Pinch

Pinch 是一款基于 AI 的实时语音翻译视频会议平台，支持超过 30 种语言，提供口译和同声传译两种模式，满足多样化的沟通需求。其核心优势在于无需字幕即可实现自然流畅的语音翻译，具备低延迟和文化敏感性处理能力，适用于国际商务、教育、家庭沟通及客户服务等场景。

AI项目与工具 2025年06月12日 90 点赞 0 评论 555 浏览

NEXUS

NEXUS-O是一款由多家知名机构联合开发的多模态AI模型，能够处理音频、图像、视频和文本等多种输入，并以相应形式输出结果。它在视觉理解、音频问答、语音识别和翻译等方面表现出色，具备强大的跨模态对齐与交互能力。模型基于视觉语言预训练，结合高质量音频数据提升性能，并通过多模态任务联合训练增强泛化能力。适用于智能语音助手、视频会议、教育、智能驾驶、医疗健康等多个领域。

AI项目与工具 2025年06月12日 84 点赞 0 评论 542 浏览

TicVoice 7.0

TicVoice 7.0 是一款基于 Spark-TTS 的语音合成引擎，采用 BiCodec 技术实现音色与语义的精准控制，支持 3 秒语音克隆、多角色、多情绪表达及中英切换，语音自然流畅，接近广播级水平，适用于智能客服、有声书、影视配音等场景。

AI项目与工具 2025年06月12日 29 点赞 0 评论 541 浏览

Chikka.ai

Chikka.ai 是一款基于AI语音代理的客户访谈平台，支持多语言、大规模对话，提供个性化访谈设计、自动转录与分析功能。适用于客户反馈、员工意见、产品开发等场景，帮助企业高效获取洞察，优化决策流程。

AI项目与工具 2025年06月12日 42 点赞 0 评论 477 浏览

URO

URO-Bench 是一个面向端到端语音对话模型的综合评估工具，支持多语言、多轮对话及副语言信息处理。它包含基础和高级两个赛道，分别涵盖16个和20个数据集，覆盖开放性问答、情感生成、多语言任务等。支持多种评估指标，提供简单易用的评估流程，并兼容多种语音对话模型。适用于智能家居、个人助理、语言学习等多个实际应用场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 530 浏览

Tolan

Tolan是一款AI驱动的陪伴应用，提供个性化对话、星球互动、照片反馈及语音交流等功能，帮助用户在日常生活中获得情感支持与互动体验。其应用场景涵盖社交娱乐、创意写作、语言学习等，适用于寻求情感陪伴或趣味互动的用户。支持多平台使用，提供灵活的订阅方案。

AI项目与工具 2025年06月12日 43 点赞 0 评论 578 浏览

Tough Tongue AI 2.0

Tough Tongue AI 2.0 是一款多模态对话训练工具，适用于面试、职场沟通、销售谈判等多种场景。用户可自定义AI角色与语气，通过视频和音频反馈练习非语言沟通技巧，并获得个性化反馈以提升表达能力。支持多语言使用，可无限重试，便于反复练习。具备嵌入功能，方便集成到其他平台。

AI项目与工具 2025年06月12日 61 点赞 0 评论 571 浏览

SeedFoley

SeedFoley 是由字节跳动开发的端到端视频音效生成模型，能智能识别并生成与视频内容高度同步的动作和环境音效。通过融合视频时空特征与扩散生成技术，提升音效的准确性和细腻度，支持多种视频长度，适用于生活Vlog、短片制作、游戏视频等多种场景，显著提升视频的沉浸感和表现力。

AI项目与工具 2025年06月12日 63 点赞 0 评论 737 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期