Browser Use Browser Use是一款基于大语言模型的智能浏览器工具,支持多标签页管理和视觉识别,可提取网页内容并记录操作步骤。它允许开发者自定义动作,如保存文件或推送至数据库,并兼容多种主流LLM模型,具备并行运行和自我修正能力,旨在提升任务执行效率与准确性。 AI项目与工具 2025年06月12日 45 点赞 0 评论 256 浏览
Picarta Picarta是一款基于AI技术的图像位置识别工具,可自动分析照片并提供地理信息,支持旅行照片整理、摄影管理、新闻验证和历史研究等功能。平台注重隐私保护,提供多样化的服务模式,满足个人和企业用户的需求。 AI项目与工具 2025年06月12日 84 点赞 0 评论 487 浏览
MMedAgent MMedAgent是一款面向医疗领域的多模态AI平台,集成了指令优化的多模态大型语言模型(MLLM)及一系列定制化医疗工具,支持多种医学成像模式(如MRI、CT、X射线等),可高效处理视觉问答、分类、定位、分割、医学报告生成(MRG)及检索增强生成(RAG)等任务,显著提升了医疗数据处理效率与准确性。 AI项目与工具 2025年06月12日 45 点赞 0 评论 211 浏览
LongDocURL LongDocURL是一个由中国科学院自动化研究所和阿里巴巴联合发布的多模态长文档理解基准数据集,包含2,325组问答对,覆盖33,000页文档,涉及20个子任务。该数据集专注于评估AI模型在长文档理解、数值推理、跨元素定位及多样化任务中的性能,支持文本、图像和表格等多种模式,具有高质量和多样性的特点。 AI项目与工具 2025年06月12日 26 点赞 0 评论 198 浏览
AddressCLIP AddressCLIP 是一种基于 CLIP 技术的端到端图像地理定位模型,由中科院自动化所与阿里云联合开发。它通过图像与地址文本对齐和地理匹配技术,实现街道级别的精确定位,无需依赖 GPS。模型在多个数据集上表现优异,适用于城市管理、社交媒体、旅游导航等多个场景,具备良好的灵活性和多模态结合潜力。 AI项目与工具 2025年06月12日 30 点赞 0 评论 203 浏览
GeoSpy GeoSpy是一款基于AI技术的照片地理定位工具,可准确识别照片拍摄位置并输出经纬度坐标。它支持批量处理、地图集成和API接口,适用于研究、执法、新闻核实等多种场景,帮助用户深入挖掘图像背后的地理信息。 AI项目与工具 2025年06月12日 54 点赞 0 评论 318 浏览
ProtGPS ProtGPS是一款由MIT与怀特黑德生物医学研究所开发的深度学习模型,用于预测蛋白质在细胞内的亚细胞定位。它基于Transformer架构,能准确识别蛋白质在12种不同亚细胞区域的分布,并支持设计特定定位的蛋白质序列。该工具还可分析致病突变对蛋白质定位的影响,为疾病机制研究、蛋白质工程和药物开发提供新思路。 AI项目与工具 2025年06月12日 60 点赞 0 评论 190 浏览
Migician Migician是一款由多所高校联合开发的多模态大语言模型,专为多图像定位任务设计。它基于大规模数据集MGrounding-630k,采用端到端架构和两阶段训练方法,支持跨图像精准定位与多任务处理。Migician适用于自动驾驶、安防监控、医疗影像等多个领域,具有高效的推理能力和灵活的输入方式。 AI项目与工具 2025年06月12日 90 点赞 0 评论 366 浏览
Linkeddit Linkeddit 是一款基于 AI 技术的 Reddit 数据分析工具,能够根据用户需求智能匹配潜在客户、合作伙伴或目标受众。它提供用户画像分析、多维度筛选、实时数据更新等功能,帮助用户精准定位高价值用户。适用于市场营销、创业拓展、社区运营等场景,支持数据导出和长期使用,提升目标群体识别效率。 AI项目与工具 2025年06月12日 55 点赞 0 评论 138 浏览
DCEdit DCEdit是一款基于双层控制机制的图像编辑工具,结合精确语义定位策略与视觉、文本自注意力优化,提升图像编辑的准确性和可控性。无需额外训练即可应用于现有扩散模型,支持复杂场景下的精细编辑任务,如对象替换、颜色调整等,适用于广告、影视、社交媒体等多个领域。 AI项目与工具 2025年06月12日 15 点赞 0 评论 116 浏览