多语言 - 智狐AI导航

IndexTTS

IndexTTS 是一款由 B 站开发的高性能文本转语音系统，专注于中文语音合成，支持拼音纠正、精准停顿控制和高自然度语音输出。采用混合建模方法，结合汉字与拼音，提升发音准确性。系统具备零样本语音克隆能力，音质优秀，广泛应用于内容创作、在线教育、智能客服等领域。训练数据丰富，性能指标优异，包括低字词错误率、高扬声器相似性和高主观音质评分。

AI项目与工具 2025年06月12日 15 点赞 0 评论 579 浏览

Buzz

Buzz是一款基于OpenAI Whisper模型的离线语音转文字工具，支持实时语音转文字和音频视频文件转录。它具备多语言识别和翻译功能，支持多种格式导出，并能在本地离线操作以保护用户隐私。主要应用于视频字幕制作、采访记录整理、语言学习辅助、会议记录和学术研究等场景。

AI项目与工具 2025年06月12日 10 点赞 0 评论 580 浏览

商汤小浣熊

商汤小浣熊由商汤科技开发，包含代码小浣熊和办公小浣熊两大模块。代码小浣熊协助开发者高效完成代码编写、测试等工作，而办公小浣熊则聚焦于复杂数据分析任务，支持数据清洗、趋势预测、可视化图表生成等。两款工具均具备高度智能化和灵活性，适用于软件开发、数据分析、编程教育等多个场景。

AI项目与工具 2025年06月12日 32 点赞 0 评论 580 浏览

Chatterbox是Resemble AI推出的开源文本转语音（TTS）模型，基于0.5B规模的LLaMA架构，用超过50万小时精选音频训练。它支持零样本语音克隆，仅需5秒参考音频即可生成高度逼真的个性化语音，并具备情感夸张控制功能，可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力，延迟低至200毫秒以下，适用于交互式应用。此外，它采用安全水印技术防止滥用，适用于内容

AI项目与工具 2025年06月11日 55 点赞 0 评论 580 浏览

WebWalker

WebWalker是阿里巴巴研发的AI工具，用于评估和优化大型语言模型在网页浏览任务中的表现。它通过多智能体框架、垂直探索策略及WebWalkerQA数据集，提升模型处理长上下文和多源信息的能力。支持多语言、多领域和多难度任务，适用于信息检索、数据分析和内容监控等场景，具备良好的适应性和可扩展性。

AI项目与工具 2025年06月12日 22 点赞 0 评论 582 浏览

Notta

Notta是由MIND CRUISER LIMITED推出的语音转写软件，主要针对个人使用，并在海外拥有数十万用户。这款软件具有录音实时转写、音/视频导入转写、文本多格式导出、音频标记等功能，...

Ai办公效率 2026年07月27日 0 点赞 0 评论 584 浏览

BuzzClip

BuzzClip 是一款基于人工智能的视频生成工具，专注于帮助用户在短时间内高效制作适合 TikTok 等平台的短视频内容。平台提供超过 100 个 AI 虚拟形象、多种预设模板及多语言支持，适用于品牌推广、产品展示和社交媒体运营等多种场景。用户可直接发布视频并进行品牌定制，具备完整的商业使用权和基础数据分析功能，提升内容创作效率与传播效果。

AI项目与工具 2025年06月12日 60 点赞 0 评论 584 浏览

文心快码Zulu

百度文心快码推出的一款 AI 自动编程智能体，能够自主理解编码需求，精准拆解任务，并突破单文件限制，实现跨模块、跨目录的系统级代码生成。

Ai编程建站 2025年06月05日 34 点赞 0 评论 585 浏览

Speech

Speech-02 是 MiniMax 推出的先进文本到语音模型，支持零样本语音克隆和高质量语音合成，具备多语言支持和情感控制功能。采用自回归 Transformer 和 Flow-VAE 架构提升语音自然度和相似度，适用于配音、有声读物、智能助手等多种场景。提供 HD 和 Turbo 两个版本，满足不同性能需求。

AI项目与工具 2025年06月11日 33 点赞 0 评论 586 浏览

spiritme

Spiritme是一款基于人工智能的视频创作工具，支持用户通过拍摄或输入文本生成逼真的数字化身视频。其核心功能包括数字化身创建、文本转视频转换、AI辅助拍摄及多语言支持，适用于营销、教育、社交媒体及企业演示等多种应用场景，为用户提供了高效且灵活的视频制作解决方案。

AI项目与工具 2025年06月12日 80 点赞 0 评论 588 浏览

多语言

首页

多语言

列表

默认

浏览次数

发布日期