多语言 - 智狐AI导航

Scribe

Scribe 是由 ElevenLabs 推出的高精度语音转文本模型，支持 99 种语言，具备多说话者区分、非语言事件检测和单词级时间戳功能。输出结构化的 JSON 数据，适用于会议记录、字幕生成、内容创作等多种场景，广泛应用于教育、客服及媒体领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 717 浏览

IndexTTS

IndexTTS 是一款由 B 站开发的高性能文本转语音系统，专注于中文语音合成，支持拼音纠正、精准停顿控制和高自然度语音输出。采用混合建模方法，结合汉字与拼音，提升发音准确性。系统具备零样本语音克隆能力，音质优秀，广泛应用于内容创作、在线教育、智能客服等领域。训练数据丰富，性能指标优异，包括低字词错误率、高扬声器相似性和高主观音质评分。

AI项目与工具 2025年06月12日 15 点赞 0 评论 579 浏览

麦琪的花园

《麦琪的花园》是一款融合AI技术与沙盒玩法的冒险游戏，玩家可创建个性化AI伙伴并与之互动，同时建设营地、探索魔法大陆。游戏支持多语言对话和语音合成，提供沉浸式社交体验，适合沙盒、二次元及AI技术爱好者。

AI项目与工具 2025年06月12日 77 点赞 0 评论 697 浏览

AingDesk

AingDesk 是一款开源的 AI 模型部署工具，支持一键安装上百款 AI 模型，降低使用门槛。具备联网搜索功能，提升回答准确性；提供模型共享与多语言支持，便于团队协作与跨语言使用。内置模型管理器，优化本地资源利用，适用于学习、办公及学术研究等多种场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 576 浏览

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型，支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构，具备多语言支持及长文本处理能力，适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本，支持零样本学习，提升语音自然度和表现力。

AI项目与工具 2025年06月12日 71 点赞 0 评论 768 浏览

SigLIP 2

SigLIP 2 是 Google DeepMind 开发的多语言视觉-语言模型，具有强大的图像与文本对齐能力。它支持多种语言输入，具备零样本分类、图像-文本检索等功能，并通过 Sigmoid 损失函数和自监督学习技术提升训练效率与模型性能。其支持多种分辨率的变体，适用于文档理解、视觉问答及开放词汇任务。该模型基于 Vision Transformer 架构，具备良好的兼容性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 905 浏览

Indic Parler

Indic Parler-TTS 是一款由 Hugging Face 与 AI4Bharat 联合开发的多语言文本到语音模型，支持 20 种印度语言和英语，提供 69 种独特语音。该模型基于深度学习架构，通过描述性文本输入实现对音调、语速、情感等参数的灵活控制，适用于多种语音合成场景。在低资源语言上表现优异，具备高自然度和清晰度的语音输出能力。

AI项目与工具 2025年06月12日 55 点赞 0 评论 565 浏览

SignLLM

SignLLM是一款支持多语言手语生成的AI模型，能将文本转换为自然流畅的手语视频，覆盖包括ASL、GSL、LSA、KSL在内的八种手语。其核心技术包括离散化与层次化表示、自监督学习、符号-文本对齐等。该工具可用于教育、医疗、法律、媒体等多个场景，提升听障人群的沟通便利性与信息获取能力。

AI项目与工具 2025年06月12日 86 点赞 0 评论 947 浏览

Pull Sense

Pull Sense 是一款基于 AI 的代码审查工具，支持 GitHub 集成，可自动检测语法错误、安全漏洞、性能问题及代码风格不一致等问题。用户可选择多种 AI 模型，并通过自带密钥确保数据安全。支持自定义规则、多语言覆盖及灵活触发机制，适用于初创公司、大型企业、开源项目及 CI/CD 流程，提升代码质量和开发效率。

AI项目与工具 2025年06月12日 43 点赞 0 评论 658 浏览

Ovis2

Ovis2是阿里巴巴国际团队开发的多模态大语言模型，采用结构化嵌入对齐技术提升视觉与文本的融合效果。支持视频、图像和多语言处理，强化了思维链推理和复杂场景下的OCR能力。提供多个参数规模的版本，适用于研究、开发及各类应用场景，展现卓越性能。

AI项目与工具 2025年06月12日 67 点赞 0 评论 601 浏览

多语言

首页

多语言

列表

默认

浏览次数

发布日期