开源工具 - 智狐AI导航

QA

QA-MDT是一款基于文本生成高质量音乐的开源工具，其核心技术包括质量感知训练、掩蔽扩散变换器以及音乐与文本的同步优化。它能够根据用户提供的文本描述生成多样化的音乐作品，并通过质量控制确保输出结果的高保真度。此外，QA-MDT支持音乐与文本的一致性增强，适用于广告、影视配乐、音乐教育及智能设备等多个领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 810 浏览

Comic Translate

Comic Translate 是一款基于开源框架的漫画翻译工具，支持多语言翻译，涵盖英语、韩语、日语、法语、简体中文、繁体中文、俄语、德语、荷兰语、西班牙语和意大利语等主流语言。它利用深度学习技术和图像处理库，实现从文本检测、OCR 到翻译渲染的全流程自动化，旨在帮助用户突破语言限制，享受跨文化阅读体验。同时，该工具支持自定义翻译服务，适合个人娱乐、教育学习、翻译本地化及学术研究等多个领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 732 浏览

Rope

Rope是一款基于深度学习的开源AI换脸工具，利用insightface的inswapper_128模型提供直观的图形界面，支持图片和视频换脸。它具备强大的遮罩功能和参数调节选项，支持超分辨率算法，广泛应用于影视制作、游戏开发、虚拟现实等领域。

AI项目与工具 2025年06月12日 55 点赞 0 评论 620 浏览

IDIFY

IDIFY是一款开源在线证件照生成工具，借助人工智能技术实现自动抠图和标准化处理。支持本地图像处理、多平台兼容及多样化编辑功能，适用于个人、教育机构、企业和政府部门等场景，确保用户数据安全且操作便捷。

AI项目与工具 2025年06月12日 44 点赞 0 评论 648 浏览

OutofFocus

OutofFocus是一款基于AI的图像编辑工具，支持文本提示驱动的图像生成与编辑。其核心功能包括风格转换、内容填充、图像修复和增强等，通过自然语言处理与扩散逆过程重建技术实现高效编辑。该工具具有易用性和灵活性，广泛适用于艺术创作、内容营销、教育研究等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 927 浏览

GroundingBooth

GroundingBooth 是一种创新的文本到图像定制框架，通过结合文本-图像对齐模块和遮罩交叉注意力层，实现了前景主体与背景对象的空间精准对齐。其核心功能包括单主题与多主题定制、身份保留、文本-图像一致性保障及复杂场景下的高精度生成。该工具广泛应用于个性化商品定制、艺术创作、游戏设计、广告营销等多个领域，为视觉内容创作提供了强大的技术支持。

AI项目与工具 2025年06月12日 20 点赞 0 评论 602 浏览

markmap

Markmap 是一款将 Markdown 文本转化为思维导图的工具，支持实时渲染和高度可定制化，兼容多种代码编辑器。它通过解析 Markdown 语法生成树状数据结构，并利用布局算法实现直观可视化展示，广泛应用于项目规划、学术研究及教学演示等领域。

AI项目与工具 2025年06月12日 94 点赞 0 评论 808 浏览

Wren AI

Wren AI 是一个开源的文本到 SQL 工具，基于自然语言处理技术，允许用户通过自然语言提问来执行数据库查询，无需编写 SQL 代码。它支持多种数据库和数据源，具有语义理解能力，能准确解析业务上下文并提供精确的结果。Wren AI 的核心功能包括语义引擎、向量数据库和大型语言模型，支持数据集成、安全性和结果导出，广泛应用于业务智能分析、数据探索、报告生成等领域。

AI项目与工具 2025年06月12日 82 点赞 0 评论 581 浏览

Surya

Surya是一款开源OCR工具包，专注于文档识别，支持90多种语言的文本提取与分析。它能够识别文档中的文本、表格、图片及标题等布局元素，并确保文本阅读顺序的准确性。凭借其高效的表格识别能力和优化的算法，Surya在处理复杂文档时表现出色，广泛应用于文档数字化、数据提取、多语言处理以及学术研究等领域。 ---

AI项目与工具 2025年06月12日 16 点赞 0 评论 799 浏览

FunASR

FunASR是一个由阿里巴巴达摩院开源的多功能语音识别工具包，涵盖语音识别（ASR）、语音活动检测（VAD）、标点恢复、说话人验证及分离等功能。它支持工业级模型的训练与微调，并提供预训练模型和易用接口，便于快速部署。新增的Whisper-large-v3-turbo模型进一步提升了其性能，广泛应用于智能助手、会议记录、客服系统和语音搜索等领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 808 浏览

开源工具

首页

开源工具

列表

默认

浏览次数

发布日期

QA