音频 - 智狐AI导航

Ztalk.ai

Ztalk.ai 是一款支持多语言实时语音翻译的AI桌面应用，具备低延迟、高清晰度和强兼容性，可与主流视频会议平台无缝连接。内置降噪、字幕及AI提示功能，确保沟通效率与质量。采用端到端加密，保障数据安全，适用于全球商务会议、跨境协作、客户互动及多语言培训等场景。

AI项目与工具 2025年06月11日 75 点赞 0 评论 511 浏览

Avatar IV

Avatar IV 是 HeyGen 推出的 AI 数字人模型，支持用户通过上传照片和语音快速生成逼真视频。该工具基于音频驱动的表情引擎，能精准捕捉语音中的语调、节奏和情感，生成自然流畅的面部表情和动作。操作简单，无需专业技能，适用于多种角色形象，涵盖社交媒体、企业营销、在线教育等多个领域，是高效内容创作的理想选择。

AI项目与工具 2025年06月11日 45 点赞 0 评论 724 浏览

HunyuanCustom

HunyuanCustom是腾讯混元团队开发的多模态视频生成框架，支持图像、音频、视频和文本等多种输入条件，生成高质量定制化视频。采用文本-图像融合与图像ID增强技术，提升身份一致性和视频真实性。适用于虚拟人广告、虚拟试穿、视频编辑等场景，具备音频驱动和视频驱动两种生成方式，展现强大可控性与灵活性。

AI项目与工具 2025年06月11日 73 点赞 0 评论 613 浏览

ListenHub

ListenHub 是一款基于 AI 技术的播客生成工具，支持中英文内容处理，可快速生成高质量播客。它能自动生成主题、脚本，并提供超真实人声体验。用户可自定义角色、编辑音频并一键发布至多个平台，适用于个人创作、知识分享和娱乐休闲等多种场景。

AI项目与工具 2025年06月11日 57 点赞 0 评论 430 浏览

Audio

Audio-SDS是由NVIDIA研发的音频处理技术，基于文本提示引导音频生成，支持音效生成、音源分离、FM合成及语音增强等多种任务。该技术无需重新训练模型，即可将预训练音频扩散模型扩展为多功能工具，具备高效推理能力，适用于游戏、音乐制作、教育及智能家居等多个领域。

AI项目与工具 2025年06月11日 81 点赞 0 评论 582 浏览

Muyan

Muyan-TTS是一款面向播客场景的开源文本转语音工具，基于超10万小时播客数据训练，支持零样本语音合成与说话人适配，可在0.33秒内生成1秒音频，适合实时与长内容合成。支持本地部署与API调用，应用于播客、有声书、视频配音、AI角色及新闻播报等领域，兼具高效性与灵活性。

AI项目与工具 2025年06月11日 94 点赞 0 评论 455 浏览

AIShowX

AIShowX是一款多功能AI工具平台，支持文本转视频、图片转视频、视频增强、图像生成与风格转换等功能。用户可通过简单操作生成高质量视频和图像，适用于创作、影视、营销、教育及社交等多个领域。平台提供图像锐化、动画添加及音频处理等辅助功能，提升内容表现力与专业度。

AI项目与工具 2025年06月11日 99 点赞 0 评论 718 浏览

Nooka

Nooka是一款基于AI技术的听书应用，提供全球非虚构类书籍的20分钟音频摘要，适合碎片化时间学习。用户可随时提问并获得AI即时回答，实现深度互动。应用支持多语言字幕、音频剪辑分享及社区交流，适用于通勤、运动、家务等多种场景，提升学习效率与趣味性。

AI项目与工具 2025年06月11日 16 点赞 0 评论 427 浏览

Stable Audio Open Small

Stable Audio Open Small 是由 Stability AI 与 Arm 联合开发的轻量级文本到音频生成模型，参数量降至 3.41 亿，适配移动设备和边缘计算场景。基于深度学习与模型压缩技术，支持快速生成音效、音乐片段等音频内容，适用于实时音频生成任务。具备高效运行、低功耗、多场景应用等特点，可用于音乐创作、游戏音效、视频配乐等领域。

AI项目与工具 2025年06月11日 35 点赞 0 评论 703 浏览

SeeMuseums

SeeMuseums 是一款基于AI的智能导览工具，支持多语言、智能推荐和AI音频讲解，帮助用户个性化探索博物馆内容。用户可通过提问获取详细解读，记录笔记并保存收藏，适用于艺术学习、文化探索和教育辅助等多种场景，提升参观体验与知识获取效率。

AI项目与工具 2025年06月11日 71 点赞 0 评论 661 浏览

音频

首页

音频

列表

默认

浏览次数

发布日期