开源 - 智狐AI导航

Umi

Umi-OCR 是一款离线 OCR 工具，支持图片、截图和 PDF 文档的文字识别，具备数学公式与二维码识别功能，可生成可搜索 PDF。支持多语言识别与界面切换，提供命令行和 HTTP 接口调用，适用于文档数字化、数据录入、教育等多个场景。

AI项目与工具 2025年06月12日 51 点赞 0 评论 629 浏览

FreeCodeCamp

一个非营利性开源编程学习平台，可以帮助人们免费学习编程。freeCodeCamp 提供丰富的编程学习内容，包括HTML、CSS、JavaScript、Python、SQL等多种技术和框架。

Ai学习资源 2025年06月05日 83 点赞 0 评论 628 浏览

6pen pro

整合最新AI技术，为有深度需求的用户打造更专业的内容创作体验，提供内容库、AI生成器等专业化功能，助您轻松创造令人惊叹的多媒体内容。

Ai学习资源 2025年06月05日 72 点赞 0 评论 628 浏览

AnythingLLM

AnythingLLM 是一款开源、多模态的 AI 客户端工具，支持文本、图像和音频输入，可将文档转化为上下文信息供语言模型使用。支持本地和云端部署，具备多用户管理、工作区隔离、丰富的文档格式支持和强大的 API 接口。适用于企业知识管理、学术研究、个人学习、内容创作等多种场景，保障数据隐私安全。

AI项目与工具 2025年06月12日 37 点赞 0 评论 627 浏览

MagicMirror

MagicMirror是一款基于深度学习的开源AI工具，提供面部替换、发型调整和穿搭模拟功能。其特点包括易用性、硬件兼容性、隐私保护及轻量化设计，支持离线运行，适用于个人娱乐、创意设计及虚拟角色扮演等场景。

AI项目与工具 2025年06月12日 17 点赞 0 评论 627 浏览

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目，包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识，支持超过50种语言；CosyVoice则专注于自然语音生成，支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景，其相关模型和代码已公开发布。

AI项目与工具 2025年06月12日 66 点赞 0 评论 626 浏览

Open Avatar Chat

Open Avatar Chat是阿里开源的模块化实时数字人对话系统，支持低延迟交互与多模态输入输出。系统采用模块化架构，允许灵活配置语音识别、语言模型和语音合成等组件，兼容本地与云服务。支持2D/3D数字人渲染，适用于客户服务、教育、娱乐及企业应用等多个场景，为开发者提供高效、灵活的AI对话解决方案。

AI项目与工具 2025年06月11日 81 点赞 0 评论 625 浏览