数据
LongDocURL
LongDocURL是一个由中国科学院自动化研究所和阿里巴巴联合发布的多模态长文档理解基准数据集,包含2,325组问答对,覆盖33,000页文档,涉及20个子任务。该数据集专注于评估AI模型在长文档理解、数值推理、跨元素定位及多样化任务中的性能,支持文本、图像和表格等多种模式,具有高质量和多样性的特点。
亮数据BrightData
一家专注于为企业提供网络数据收集和代理服务的公司,亮数据BrightData提供全面的网络数据解决方案,包括高级代理网络、AI驱动的网络抓取工具、动态更新的数据集等功能。
