语音 - 智狐AI导航

Avatar IV

Avatar IV 是 HeyGen 推出的 AI 数字人模型，支持用户通过上传照片和语音快速生成逼真视频。该工具基于音频驱动的表情引擎，能精准捕捉语音中的语调、节奏和情感，生成自然流畅的面部表情和动作。操作简单，无需专业技能，适用于多种角色形象，涵盖社交媒体、企业营销、在线教育等多个领域，是高效内容创作的理想选择。

AI项目与工具 2025年06月11日 45 点赞 0 评论 767 浏览

Ztalk.ai

Ztalk.ai 是一款支持多语言实时语音翻译的AI桌面应用，具备低延迟、高清晰度和强兼容性，可与主流视频会议平台无缝连接。内置降噪、字幕及AI提示功能，确保沟通效率与质量。采用端到端加密，保障数据安全，适用于全球商务会议、跨境协作、客户互动及多语言培训等场景。

AI项目与工具 2025年06月11日 75 点赞 0 评论 548 浏览

今天学点啥

“今天学点啥”是一款由秘塔AI开发的AI学习工具，支持用户通过关键词、文档或网页链接生成个性化互动课程，包含PPT和语音讲解。提供多种讲解风格与知识水平适配，具备实时互动、答题挑战和智能推荐功能，适用于学术、职业、兴趣及教育等多种学习场景，提升学习效率与趣味性。

AI项目与工具 2025年06月11日 33 点赞 0 评论 824 浏览

Voila

Voila是一款开源的端到端语音大模型，支持实时语音交互与多轮对话，具备高保真、低延迟的音频处理能力。集成语音与语言建模功能，支持百万级预设声音及个性化定制，适用于语音助手、角色扮演、语音翻译等场景。采用多尺度Transformer架构，提升语音理解与生成质量，降低开发成本，提高通用性与灵活性。

AI项目与工具 2025年06月11日 60 点赞 0 评论 806 浏览

Aero

Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型，拥有 1.5 亿参数，专注于长音频处理，支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色，具备高效的训练方法和多任务处理能力，适用于语音助手、实时转写、归档理解等场景。

AI项目与工具 2025年06月11日 43 点赞 0 评论 536 浏览

VoltAgent

VoltAgent 是一个开源的 TypeScript 框架，用于构建和编排 AI Agent。它提供基础架构和工具，简化与大语言模型的交互、状态管理、外部工具连接及工作流编排。支持多 Agent 系统、记忆管理、RAG 技术、语音交互等功能，并具备可视化监控和灵活的 LLM 支持，适用于智能客服、数据处理、语音控制等多种场景。

AI项目与工具 2025年06月11日 84 点赞 0 评论 645 浏览

CircleBack

CircleBack 是一款基于 AI 的会议记录工具，支持多语言转录与智能总结，能自动生成结构化笔记和行动项。其具备强大的口音识别能力，可与 Zoom、Google Meet、Microsoft Teams 等平台集成，适用于企业会议、远程协作、教育、客户服务及医疗等多个场景。此外，它还支持语义搜索和工作流自动化，提升会议管理效率。

AI项目与工具 2025年06月11日 29 点赞 0 评论 843 浏览

OceanDoc

OceanDoc是科大讯飞推出的AI智能办公工具，基于大语言模型和自然语言处理技术，可自动将文本转化为高质量PPT幻灯片，并提供设计建议、多语言翻译、语音控制、AI图像生成等功能。适用于办公、教育、企业等多种场景，简化演示文稿制作流程，提升效率与专业性。

AI项目与工具 2025年06月11日 44 点赞 0 评论 852 浏览

Lemon Slice Live

Lemon Slice Live 是一款基于扩散变换器模型（DiT）的实时视频聊天工具，可将图片转化为可互动的动画角色，支持多语言和实时对话。通过优化模型提升流畅度与响应速度，适用于娱乐、教育、营销等多种场景，结合语音识别、文本生成等技术，提供完整的交互体验。

AI项目与工具 2025年06月11日 61 点赞 0 评论 680 浏览

小饿

小饿是饿了么推出的AI语音助手，专为外卖骑手设计，支持语音交互完成接单、确认到店等操作，提升配送效率。具备权益提醒、天气预警、路线提示、订单热力图及收入预估等功能，覆盖多种配送场景，增强用户体验。已在多个城市上线，适用于蜂鸟众包APP用户。

AI项目与工具 2025年06月11日 12 点赞 0 评论 768 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期