DINO-X是由IDEA研究院开发的一款通用视觉大模型,具备开放世界对象检测与理解的能力。该模型支持文本、视觉及定制化提示,并能够识别图像中的任意对象,无需额外的用户提示。依托于超过1亿样本的Grounding-100M数据集,DINO-X在COCO、LVIS-minival和LVIS-val等基准测试中展现了卓越的性能。DINO-X分为DINO-X Pro和DINO-X Edge两个版本,分别侧重于强大的感知能力和高效的推理速度,适用于边缘设备部署。该模型在长尾物体识别方面表现突出,可广泛应用于自动驾驶、智能安防等多个领域,推动产业升级。
发表评论 取消回复