结构化数据

Playwright MCP

Playwright MCP是微软推出的轻量级浏览器自动化工具，基于Model Context Protocol（MCP）协议，通过Playwright的可访问性树实现与网页的交互，无需依赖视觉模型或截图。支持多种浏览器，提供丰富的交互功能，如点击、拖动、输入文本等，适用于与大语言模型结合使用。具备结构化数据交互、网络请求管理、测试脚本生成等功能，支持无头和有头模式运行，适用于自动化测试、网页操作

AI项目与工具 2025年06月11日 22 点赞 0 评论 412 浏览

Platon.AI

Platon.AI柏拉图智能不仅仅是 AI 爬虫，也是 AI agents 的基础设施。 AI agents 要使用工具，就必须高速阅读理解在线网页，理解网页上的每一个元素——这就是 platon.AI 的技术。

Ai开源项目 2025年06月05日 95 点赞 0 评论 467 浏览

ScrapeGraphAI

ScrapeGraphAI 是一款基于大型语言模型（LLM）的智能网络爬虫工具包，能够高效提取结构化数据。其核心功能包括 SmartScraper、SearchScraper 和 Markdownify，支持自然语言驱动的爬取、多页面搜索、自适应爬取、多模型和多平台兼容，可生成代码并存储为 CSV 或 JSON 格式。适用于市场分析、学术研究、产品信息收集等场景。

AI项目与工具 2025年06月11日 53 点赞 0 评论 479 浏览

Versatile

Versatile-OCR-Program是一款开源多模态OCR工具，支持从教育材料中提取文本、公式、表格等结构化数据，输出为JSON或Markdown格式，准确率高达90%-95%。它基于DocLayout-YOLO、Google Vision和MathPix等技术，支持多语言处理，适用于教育数据集制作、教学辅助、AI模型训练及个人学习等场景。

AI项目与工具 2025年06月11日 77 点赞 0 评论 491 浏览

OmniAI

OmniAI是一款基于OCR与NLP技术的智能文档处理平台，支持多种文件格式的数据提取与分类。其核心功能包括批量处理、结构化数据输出以及自定义模型开发，适用于财务审计、客户服务、法律合规、医疗健康及保险理赔等多个领域，为企业提供高效的文档智能化解决方案。

AI项目与工具 2025年06月12日 79 点赞 0 评论 497 浏览

Jina Reader

Jina Reader是一款由Jina AI开发的开源工具，专注于将互联网上的HTML网页内容转换为适合大型语言模型处理的纯文本格式。它支持多种内容格式，具备流模式、JSON模式和Alt生成模式等功能，能够高效提取网页核心内容，去除冗余信息，并通过自然语言处理和动态内容处理技术提升文本质量和理解能力。Jina Reader适用于内容聚合、SEO优化、学术研究及个性化推荐等多个领域。

AI项目与工具 2025年06月12日 52 点赞 0 评论 507 浏览

MonkeyOCR

MonkeyOCR是由华中科技大学与金山办公联合开发的文档解析模型，能够高效地将非结构化文档内容转换为结构化信息。其支持多种文档类型和语言，处理复杂文档（如公式、表格）效果显著，处理速度达每秒0.84页。基于SRR三元组范式和MonkeyDoc数据集，模型在准确性和效率上表现优异，适用于自动化业务流程、数字存档、智能教育、医疗记录管理及学术研究等场景。

AI项目与工具 2025年06月11日 15 点赞 0 评论 519 浏览

Claude 3.5 Haiku

Claude 3.5 Haiku 是 Anthropic 推出的高性能人工智能模型，具备强大的编码能力和低延迟特性，适合复杂推理与问题解决任务。它通过“Unstructured Generalization”算法优化非结构化数据处理，并引入“宪法 AI”确保行为符合道德规范。此外，该模型支持“计算机使用”功能，能够模拟人类与计算机交互，广泛应用于自动化桌面任务、虚拟助手构建、医疗决策支持、教育及客

AI项目与工具 2025年06月12日 12 点赞 0 评论 533 浏览

OmniParse

OmniParse是一款开源数据解析平台，支持多种文件类型的非结构化数据转换为结构化格式，包括文档、图像、视频、音频及网页内容。其核心功能涵盖表格提取、图像字幕生成、音视频转录以及网页内容结构化处理，利用自然语言处理、光学字符识别及深度学习技术提升解析效率与准确性。OmniParse完全在本地运行，确保数据隐私与安全，广泛应用于文档自动化处理、客户服务、市场研究、法律合规及医疗记录管理等领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 538 浏览

OmniParser

OmniParser是一款由微软研究院开发的屏幕解析工具，能够将UI截图转换为结构化数据，通过识别可交互图标和提取功能语义，提升基于大型语言模型的UI代理系统的性能。它支持跨平台应用，无需依赖额外信息，适用于自动化软件测试、虚拟助手、辅助技术等多个领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 546 浏览

结构化数据

首页

结构化数据

列表

默认

浏览次数

发布日期