定位 - 智狐AI导航

Picarta

Picarta是一款基于AI技术的图像位置识别工具，可自动分析照片并提供地理信息，支持旅行照片整理、摄影管理、新闻验证和历史研究等功能。平台注重隐私保护，提供多样化的服务模式，满足个人和企业用户的需求。

AI项目与工具 2025年06月12日 84 点赞 0 评论 943 浏览

天壤万卷

天壤万卷是一款基于AI的文档处理工具，支持多格式文档（含超大文件和扫描件）的处理。其核心功能包括混合检索、跨语言问答、精准定位和溯源答案，同时配备表格、图像、公式识别等实用工具及行业模板，适用于法律、学术、金融等多个领域。

AI项目与工具 2025年06月12日 24 点赞 0 评论 891 浏览

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型，通过“扩展-压缩”策略优化处理高分辨率图像和长视频，兼具效率与准确性。它在图像和视频基准测试中表现优异，支持时间定位、机器人导航和医疗成像等应用场景，并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

AI项目与工具 2025年06月12日 68 点赞 0 评论 833 浏览

LocAgent

LocAgent是一款由多所高校联合开发的代码定位工具，通过构建代码库的图结构并结合大语言模型进行多跳推理，帮助开发者快速找到需修改的代码片段。支持多种开发任务，如错误修复、功能添加和性能优化，具备高效的搜索与定位能力，适用于大规模代码维护场景。

AI项目与工具 2025年06月12日 39 点赞 0 评论 830 浏览

ShowUI

ShowUI是一款由新加坡国立大学Show Lab与微软合作开发的视觉-语言-行动模型，旨在提升图形用户界面（GUI）助手的工作效率。该模型通过UI引导的视觉令牌选择、交错视觉-语言-行动流以及高质量数据集的运用，实现了高效的零样本截图定位和GUI自动化功能，广泛应用于网页自动化、移动应用测试、桌面软件自动化及游戏自动化等领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 789 浏览

Migician

Migician是一款由多所高校联合开发的多模态大语言模型，专为多图像定位任务设计。它基于大规模数据集MGrounding-630k，采用端到端架构和两阶段训练方法，支持跨图像精准定位与多任务处理。Migician适用于自动驾驶、安防监控、医疗影像等多个领域，具有高效的推理能力和灵活的输入方式。

AI项目与工具 2025年06月12日 90 点赞 0 评论 769 浏览

36氪

提供创业资讯、科技新闻、投融资对接、股权投资、极速融资等创业服务

媒体资讯 2025年06月05日 14 点赞 0 评论 761 浏览

DynaMem

DynaMem是一款由纽约大学与Hello Robot共同研发的动态空间语义记忆系统，旨在应对开放环境下的移动操作挑战。该系统通过构建特征点云来存储环境信息，并利用RGBD观测数据动态调整记忆库。它支持文本查询定位物体，同时具备强大的动态物体处理能力，广泛应用于家庭、工业、仓储管理以及灾难救援等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 744 浏览

万媒易发

让您轻松实现自媒体内容同步、营销、分发。支持跨平台多账号管理，一键同步发布文章，解放双手，释放生产力，是内容运营必备的一文多发工具。

裂变增长 2025年06月05日 89 点赞 0 评论 721 浏览

GeoSpy

GeoSpy是一款基于AI技术的照片地理定位工具，可准确识别照片拍摄位置并输出经纬度坐标。它支持批量处理、地图集成和API接口，适用于研究、执法、新闻核实等多种场景，帮助用户深入挖掘图像背后的地理信息。

AI项目与工具 2025年06月12日 54 点赞 0 评论 691 浏览

定位

首页

定位

列表

默认

浏览次数

发布日期