文档转换

SmolDocling

SmolDocling-256M-preview 是一款轻量级多模态文档处理模型,能将图像文档高效转换为结构化文本,支持文本、公式、图表等多种元素识别。模型参数量仅256M,推理速度快,适合学术与技术文档处理。具备OCR、布局识别、格式导出等功能,并兼容Docling,适用于文档数字化、科学研究及移动环境应用。

TextIn Tools

是一款免费在线OCR工具,包含文字识别、表格识别,PDF转文件等功能,识别率高,体验好,免费。

Pandoc

一款强大的跨平台文档格式转换工具,支持数十种文件格式的相互转换,涵盖常见的文本、标记语言、电子书、演示文稿等类型,被广泛应用于学术写作、技术文档、博客写作等场景。