MinerU是由上海人工智能实验室OpenDataLab团队开发的开源智能数据提取工具,专为复杂PDF文档提供高效的解析与提取服务。该工具能够将包含图片、公式、表格等元素的多模态PDF文档转换为易于分析的Markdown格式,支持从网页和电子书中提取内容,提高AI语料准备的效率。MinerU拥有高精度的PDF模型解析工具链,支持多种输入模型,自动识别并纠正乱码,同时保留文档结构。它还能够将公式转换为LaTeX格式,适用于学术、财务、法律等多个领域,并支持CPU和GPU,兼容Windows、Linux和Mac平台。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部