OCR技术

Math.Now

一个由Math GPT提供支持的免费AI数学解题工具，它专为解决各种数学难题而设计，覆盖了代数、几何、微积分等多个领域。

教育学习 2025年06月05日 98 点赞 0 评论 993 浏览

DocTranslator

DocTranslator是一款支持多格式文档翻译的AI工具，可处理PDF、Word、Excel、PPT等多种文件类型，并保留原始排版。它支持100多种语言，具备OCR功能，能处理图像文件。适用于商业、学术和演示文稿等场景，支持大文件处理，操作便捷高效。

AI项目与工具 2025年06月12日 74 点赞 0 评论 1616 浏览

Marker

Marker 是一款开源的高精度文档转换工具，支持 PDF、Word 等多种格式向 Markdown、JSON 和 HTML 的转换。它利用深度学习技术自动去除干扰元素，支持多语言处理，具备表格、代码块、公式识别及图像提取等功能，适用于学术研究、技术文档、教育资料等多种场景。同时支持硬件加速和批量处理，提升转换效率与用户体验。

AI项目与工具 2025年06月12日 26 点赞 0 评论 658 浏览

Ovis2

Ovis2是阿里巴巴国际团队开发的多模态大语言模型，采用结构化嵌入对齐技术提升视觉与文本的融合效果。支持视频、图像和多语言处理，强化了思维链推理和复杂场景下的OCR能力。提供多个参数规模的版本，适用于研究、开发及各类应用场景，展现卓越性能。

AI项目与工具 2025年06月12日 67 点赞 0 评论 602 浏览

NoteGen

NoteGen是一款开源AI笔记工具，支持截图识别、剪贴板监听和文本输入，通过OCR和AI技术将碎片信息整理为结构化Markdown笔记。内置Markdown编辑器与AI写作助手，支持大纲生成、公式编辑、流程图绘制及翻译优化。支持多设备同步与GitHub私有仓库管理，保障数据安全，适用于知识管理、学习研究、创作写作及团队协作等场景。

AI项目与工具 2025年06月12日 93 点赞 0 评论 972 浏览

Vision Parse

Vision Parse 是一款开源工具，旨在通过视觉语言模型将 PDF 文件转换为 Markdown 格式。它具备智能识别和提取 PDF 内容的能力，包括文本和表格，并能保持原有格式与结构。此外，Vision Parse 支持多种视觉语言模型，确保解析的高精度与高速度。其应用场景广泛，涵盖学术研究、法律文件处理、技术支持文档以及电子书制作等领域。

AI项目与工具 2025年06月12日 72 点赞 0 评论 703 浏览

Manga Image Translator

Manga Image Translator 是一个开源的漫画图片文字翻译工具，基于 OCR 和机器翻译技术，实现对漫画和图片中文字的自动识别与翻译。它支持多语言翻译，包括日文、中文、英文和韩文，并具备图像合成能力，保持原图风格。工具提供批量处理和在线/离线翻译功能，适用于漫画爱好者、语言学习者以及出版商等用户群体。

AI项目与工具 2025年06月12日 16 点赞 0 评论 676 浏览

AutoConsis

AutoConsis是一款基于深度学习和大型语言模型的UI内容一致性智能检测工具，能够自动识别和提取界面中的关键数据，并对数据一致性进行高效校验。它支持多业务场景适配，具备高泛化性和高置信度，广泛应用于电商、金融、旅游等多个领域，助力提升用户体验和系统可靠性。

AI项目与工具 2025年06月12日 10 点赞 0 评论 765 浏览

OmniAI

OmniAI是一款基于OCR与NLP技术的智能文档处理平台，支持多种文件格式的数据提取与分类。其核心功能包括批量处理、结构化数据输出以及自定义模型开发，适用于财务审计、客户服务、法律合规、医疗健康及保险理赔等多个领域，为企业提供高效的文档智能化解决方案。

AI项目与工具 2025年06月12日 79 点赞 0 评论 685 浏览

Comic Translate

Comic Translate 是一款基于开源框架的漫画翻译工具，支持多语言翻译，涵盖英语、韩语、日语、法语、简体中文、繁体中文、俄语、德语、荷兰语、西班牙语和意大利语等主流语言。它利用深度学习技术和图像处理库，实现从文本检测、OCR 到翻译渲染的全流程自动化，旨在帮助用户突破语言限制，享受跨文化阅读体验。同时，该工具支持自定义翻译服务，适合个人娱乐、教育学习、翻译本地化及学术研究等多个领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 783 浏览

OCR技术

首页

OCR技术

列表

默认

浏览次数

发布日期