OCR - 智狐AI导航

Versatile

Versatile-OCR-Program是一款开源多模态OCR工具，支持从教育材料中提取文本、公式、表格等结构化数据，输出为JSON或Markdown格式，准确率高达90%-95%。它基于DocLayout-YOLO、Google Vision和MathPix等技术，支持多语言处理，适用于教育数据集制作、教学辅助、AI模型训练及个人学习等场景。

AI项目与工具 2025年06月11日 77 点赞 0 评论 492 浏览

DocTranslator

DocTranslator是一款支持多格式文档翻译的AI工具，可处理PDF、Word、Excel、PPT等多种文件类型，并保留原始排版。它支持100多种语言，具备OCR功能，能处理图像文件。适用于商业、学术和演示文稿等场景，支持大文件处理，操作便捷高效。

AI项目与工具 2025年06月12日 74 点赞 0 评论 1484 浏览

DeepPDF

DeepPDF 是一款基于 AI 的在线 PDF 处理工具，支持文档智能问答、自动摘要生成、多语言翻译、图像与公式解析、术语解释及格式转换等功能。其特点在于保留原文排版、支持多种语言、提供高效的文档管理能力，广泛应用于教育、科研和职场场景，提升文档处理效率与信息理解能力。

AI项目与工具 2025年06月12日 61 点赞 0 评论 766 浏览

pdf

pdf-craft 是一款专注于将扫描书籍的 PDF 文件转换为 Markdown 和 EPUB 格式的工具。它结合 DocLayout-YOLO 布局分析与 PaddleOCR 文本识别技术，精准提取正文内容并优化阅读顺序，支持跨页处理与结构化输出。适用于学术研究、电子书制作、文档存档及教育资料整理等多种场景。

AI项目与工具 2025年06月12日 23 点赞 0 评论 690 浏览

AI速搭

AI速搭是百度智能云推出的低代码开发平台，支持可视化操作，无需编程即可快速构建智能应用。集成文心一言、人脸识别、OCR等AI能力，提供数据管理、API对接、流程控制等功能，适用于内容创作、智能客服、数据分析等多种场景，提升开发效率与智能化水平。

AI项目与工具 2025年06月12日 85 点赞 0 评论 749 浏览

IKI AI

IKI AI 是一款AI驱动的知识管理平台，支持多格式内容整合、AI信息提取、OCR识别和个性化知识组织。用户可通过浏览器扩展快速保存资料，适用于学术研究、专业发展、内容创作及项目管理等场景。平台提供多种版本，满足不同需求，强调信息处理效率与团队协作能力。

AI项目与工具 2025年06月12日 48 点赞 0 评论 869 浏览

Tesseract

Tesseract是一款开源的光学字符识别（OCR）引擎，支持多语言识别和多种图像格式。其具备高精度的文字识别能力，适用于文档数字化、表格数据提取、发票识别及移动OCR应用等多个场景。支持跨平台运行，并提供丰富的编程接口和自定义训练功能，便于开发者集成和优化识别效果。

AI项目与工具 2025年06月12日 12 点赞 0 评论 645 浏览

Umi

Umi-OCR 是一款离线 OCR 工具，支持图片、截图和 PDF 文档的文字识别，具备数学公式与二维码识别功能，可生成可搜索 PDF。支持多语言识别与界面切换，提供命令行和 HTTP 接口调用，适用于文档数字化、数据录入、教育等多个场景。

AI项目与工具 2025年06月12日 51 点赞 0 评论 630 浏览

Marker

Marker 是一款开源的高精度文档转换工具，支持 PDF、Word 等多种格式向 Markdown、JSON 和 HTML 的转换。它利用深度学习技术自动去除干扰元素，支持多语言处理，具备表格、代码块、公式识别及图像提取等功能，适用于学术研究、技术文档、教育资料等多种场景。同时支持硬件加速和批量处理，提升转换效率与用户体验。

AI项目与工具 2025年06月12日 26 点赞 0 评论 519 浏览

SmolDocling

SmolDocling-256M-preview 是一款轻量级多模态文档处理模型，能将图像文档高效转换为结构化文本，支持文本、公式、图表等多种元素识别。模型参数量仅256M，推理速度快，适合学术与技术文档处理。具备OCR、布局识别、格式导出等功能，并兼容Docling，适用于文档数字化、科学研究及移动环境应用。

AI项目与工具 2025年03月22日 98 点赞 0 评论 523 浏览

OCR

首页

OCR

列表

默认

浏览次数

发布日期