结构化数据

PulpMiner

一款将网页数据实时转化为JSON API的工具，用户粘贴网页 URL 并指定 JSON 结构，AI 自动提取数据并格式化。

Ai编程建站 2025年06月05日 69 点赞 0 评论 758 浏览

BISHENG毕昇大模型

一款基于 Apache 2.0 License 协议正式开源的领先开源大模型应用开发平台，能搭建分析报告生成、知识库问答、对话、要素提取等多种大模型应用。

Ai平台模型 2025年06月05日 14 点赞 0 评论 901 浏览

Platon.AI

Platon.AI柏拉图智能不仅仅是 AI 爬虫，也是 AI agents 的基础设施。 AI agents 要使用工具，就必须高速阅读理解在线网页，理解网页上的每一个元素——这就是 platon.AI 的技术。

Ai开源项目 2025年06月05日 95 点赞 0 评论 572 浏览

Firecrawl Extract

只需通过简单的自然语言提示，Firecrawl Extract就能将整个网站转换为结构化数据，完全省去手动写脚本的麻烦。

数据分析 2025年06月05日 13 点赞 0 评论 881 浏览

Alpha派

讯兔科技打造的智能投研APP，主要面向投研人员提供一站式信息服务，在数万机构投资者和研究人员那里，是一个提高获取信息高效的工具。

财经投资 2025年06月05日 42 点赞 0 评论 1323 浏览

MonkeyOCR

MonkeyOCR是由华中科技大学与金山办公联合开发的文档解析模型，能够高效地将非结构化文档内容转换为结构化信息。其支持多种文档类型和语言，处理复杂文档（如公式、表格）效果显著，处理速度达每秒0.84页。基于SRR三元组范式和MonkeyDoc数据集，模型在准确性和效率上表现优异，适用于自动化业务流程、数字存档、智能教育、医疗记录管理及学术研究等场景。

AI项目与工具 2025年06月11日 15 点赞 0 评论 601 浏览

Playwright MCP是微软推出的轻量级浏览器自动化工具，基于Model Context Protocol（MCP）协议，通过Playwright的可访问性树实现与网页的交互，无需依赖视觉模型或截图。支持多种浏览器，提供丰富的交互功能，如点击、拖动、输入文本等，适用于与大语言模型结合使用。具备结构化数据交互、网络请求管理、测试脚本生成等功能，支持无头和有头模式运行，适用于自动化测试、网页操作

AI项目与工具 2025年06月11日 22 点赞 0 评论 479 浏览

ScrapeGraphAI

ScrapeGraphAI 是一款基于大型语言模型（LLM）的智能网络爬虫工具包，能够高效提取结构化数据。其核心功能包括 SmartScraper、SearchScraper 和 Markdownify，支持自然语言驱动的爬取、多页面搜索、自适应爬取、多模型和多平台兼容，可生成代码并存储为 CSV 或 JSON 格式。适用于市场分析、学术研究、产品信息收集等场景。

AI项目与工具 2025年06月11日 53 点赞 0 评论 553 浏览

Versatile

Versatile-OCR-Program是一款开源多模态OCR工具，支持从教育材料中提取文本、公式、表格等结构化数据，输出为JSON或Markdown格式，准确率高达90%-95%。它基于DocLayout-YOLO、Google Vision和MathPix等技术，支持多语言处理，适用于教育数据集制作、教学辅助、AI模型训练及个人学习等场景。

AI项目与工具 2025年06月11日 77 点赞 0 评论 562 浏览

olmOCR

olmOCR 是一款开源 PDF 文档处理工具，结合文档锚定技术和 Qwen2-VL-7B-Instruct 模型，可高效提取结构化文本并保留原始布局。支持多种文档类型，具备大规模批量处理能力和低成本优势，适用于学术研究、法律文件处理、企业文档管理及数字图书馆建设等多个场景。其开源特性与可扩展性也增强了用户的使用灵活性。

AI项目与工具 2025年06月12日 47 点赞 0 评论 629 浏览

结构化数据

首页

结构化数据

列表

默认

浏览次数

发布日期