模型可解释性

首页

模型可解释性

列表

默认

浏览次数

发布日期

MVoT

MVoT是一种多模态推理框架，通过生成图像形式的推理痕迹，增强多模态大语言模型在复杂空间推理任务中的表现。其核心技术包括多模态推理范式、token discrepancy loss以及递归生成机制，有效提升推理准确性和可解释性。该工具适用于机器人导航、自动驾驶、智能教育、医疗影像分析及VR/AR交互等多个领域，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 57 点赞 0 评论 795 浏览

模型可解释性 首页 模型可解释性

列表 默认 浏览次数 发布日期

MVoT

模型可解释性

首页

模型可解释性

列表

默认

浏览次数

发布日期