OCR

Coral AI

Coral AI 是一款基于 AI 的文档分析平台,专注于智能搜索、摘要生成、翻译及问答功能。它支持超过 90 种语言,适用于学术研究、法律分析和商业报告等场景,特别适合处理大量文档。主要功能包括智能搜索、自动摘要生成、实时翻译、引用生成、跨文档搜索、文档标记与管理等,并支持多种文件类型和图像分析。

DocTranslator

DocTranslator是一款支持多格式文档翻译的AI工具,可处理PDF、Word、Excel、PPT等多种文件类型,并保留原始排版。它支持100多种语言,具备OCR功能,能处理图像文件。适用于商业、学术和演示文稿等场景,支持大文件处理,操作便捷高效。

媒小三

媒小三 ,实用的新媒体工具大全,提供各种实用新媒体工具,如:AI配音,视频解析,短视频下载,文案提取,文章改写,标题生成等功能,帮助新媒体人一站式快捷操作。

AI Comic Translate

只需上传您想要翻译的漫画图片,用户只需上传您想要翻译的漫画图片,AI Comic Translate将自动识别文本并在几分钟内生成高质量的翻译。

TextIn

TextIn是一款利用OCR技术实现文字识别的AI平台,支持多语言且具备强大的图像处理能力。它可以从各种类型的文档中提取结构化信息,并提供灵活的部署选项,适用于金融、物流、制造业等多个领域。TextIn通过智能算法优化文档处理流程,帮助企业提升效率。

AutoConsis

AutoConsis是一款基于深度学习和大型语言模型的UI内容一致性智能检测工具,能够自动识别和提取界面中的关键数据,并对数据一致性进行高效校验。它支持多业务场景适配,具备高泛化性和高置信度,广泛应用于电商、金融、旅游等多个领域,助力提升用户体验和系统可靠性。

Vision Parse

Vision Parse 是一款开源工具,旨在通过视觉语言模型将 PDF 文件转换为 Markdown 格式。它具备智能识别和提取 PDF 内容的能力,包括文本和表格,并能保持原有格式与结构。此外,Vision Parse 支持多种视觉语言模型,确保解析的高精度与高速度。其应用场景广泛,涵盖学术研究、法律文件处理、技术支持文档以及电子书制作等领域。

PaliGemma 2 mix

PaliGemma 2 Mix 是谷歌 DeepMind 推出的多任务视觉语言模型,支持图像描述、目标检测、OCR、文档理解等功能。模型提供多种参数规模和分辨率选项,适用于不同场景。其基于开源框架开发,易于扩展,可通过简单提示切换任务。适用于科学问题解答、文档分析、电商内容生成等多个领域。

parsio

Parsio是一款利用AI技术的文档解析工具,支持从PDF、电子邮件及发票等多种文档中自动提取结构化数据。它提供PDF解析与OCR功能,支持多语言识别和表格提取,适用于业务流程优化、客户关系管理及财务管理等多个领域,帮助企业提高效率并减少错误。

Marker

Marker 是一款开源的高精度文档转换工具,支持 PDF、Word 等多种格式向 Markdown、JSON 和 HTML 的转换。它利用深度学习技术自动去除干扰元素,支持多语言处理,具备表格、代码块、公式识别及图像提取等功能,适用于学术研究、技术文档、教育资料等多种场景。同时支持硬件加速和批量处理,提升转换效率与用户体验。