PDF

OCRmyPDF

OCRmyPDF 是一款开源的命令行工具，用于将扫描 PDF 转换为可搜索、可编辑的文档。基于 Tesseract OCR 引擎，支持 100 多种语言，具备图像优化、纠偏、清洁等功能，提升识别准确率。支持多核处理与批量操作，适合高效处理大量文件，且完全离线运行，保障数据安全。

AI项目与工具 2025年06月12日 39 点赞 0 评论 556 浏览

TabTac

TabTac是一款基于AI技术的浏览器，集成了搜索增强、网页浏览优化和办公辅助功能。它支持滑词搜索、图像识别、AI摘要、邮件撰写、语音控制等实用工具，提升信息处理效率。同时具备隐私保护机制，适用于商务、学术及日常多任务场景。

AI项目与工具 2025年06月12日 22 点赞 0 评论 887 浏览

PDFtoPDF

PDFtoPDF是一款基于AI和OCR技术的PDF转换工具，支持高精度文字识别（准确率达99.5%），并能保留原始文档排版。具备多语言支持、文件压缩、跨平台使用及翻译功能，适用于学术、办公、教育和个人文档管理等多种场景，显著提升文档处理效率与便捷性。

AI项目与工具 2025年06月12日 51 点赞 0 评论 665 浏览

PDF to Podcast

PDF to Podcast 是一款由 NVIDIA 开发的 AI 工具，能够将 PDF 文档自动转换为高质量的音频内容，如播客。该工具结合了大型语言模型、文本到语音技术以及 NVIDIA NIM 微服务架构，支持从 PDF 提取信息并生成结构化文本，再通过语音合成输出自然流畅的音频。用户可自定义生成内容的重点，并支持多种部署方式，适用于企业培训、技术简报、客户服务、医疗教育等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 572 浏览

olmOCR

olmOCR 是一款开源 PDF 文档处理工具，结合文档锚定技术和 Qwen2-VL-7B-Instruct 模型，可高效提取结构化文本并保留原始布局。支持多种文档类型，具备大规模批量处理能力和低成本优势，适用于学术研究、法律文件处理、企业文档管理及数字图书馆建设等多个场景。其开源特性与可扩展性也增强了用户的使用灵活性。

AI项目与工具 2025年06月12日 47 点赞 0 评论 629 浏览

Marker

Marker 是一款开源的高精度文档转换工具，支持 PDF、Word 等多种格式向 Markdown、JSON 和 HTML 的转换。它利用深度学习技术自动去除干扰元素，支持多语言处理，具备表格、代码块、公式识别及图像提取等功能，适用于学术研究、技术文档、教育资料等多种场景。同时支持硬件加速和批量处理，提升转换效率与用户体验。

AI项目与工具 2025年06月12日 26 点赞 0 评论 594 浏览

Umi

Umi-OCR 是一款离线 OCR 工具，支持图片、截图和 PDF 文档的文字识别，具备数学公式与二维码识别功能，可生成可搜索 PDF。支持多语言识别与界面切换，提供命令行和 HTTP 接口调用，适用于文档数字化、数据录入、教育等多个场景。

AI项目与工具 2025年06月12日 51 点赞 0 评论 704 浏览

pdf-craft 是一款专注于将扫描书籍的 PDF 文件转换为 Markdown 和 EPUB 格式的工具。它结合 DocLayout-YOLO 布局分析与 PaddleOCR 文本识别技术，精准提取正文内容并优化阅读顺序，支持跨页处理与结构化输出。适用于学术研究、电子书制作、文档存档及教育资料整理等多种场景。

AI项目与工具 2025年06月12日 23 点赞 0 评论 766 浏览

Elmo Chat

Elmo Chat 是一款基于 AI 技术的浏览器扩展工具，支持网页、视频、PDF 等多种格式的内容摘要、实时问答、关键词提取及多语言翻译功能。无需注册即可使用，注重用户隐私保护，适用于学习、办公、视频处理及多语言信息获取等场景，提升信息处理效率与便捷性。

AI项目与工具 2025年06月12日 65 点赞 0 评论 728 浏览

DeepPDF

DeepPDF 是一款基于 AI 的在线 PDF 处理工具，支持文档智能问答、自动摘要生成、多语言翻译、图像与公式解析、术语解释及格式转换等功能。其特点在于保留原文排版、支持多种语言、提供高效的文档管理能力，广泛应用于教育、科研和职场场景，提升文档处理效率与信息理解能力。

AI项目与工具 2025年06月12日 61 点赞 0 评论 842 浏览

PDF

首页

PDF

列表

默认

浏览次数

发布日期