影像分析 - 智狐AI导航

Insight

Insight-V是一款由南洋理工大学、腾讯和清华大学联合研发的多模态大型语言模型，专为提升长链视觉推理能力而设计。该模型通过多智能体系统将任务分解为推理与总结两步，并采用两阶段训练流程优化性能。其渐进式数据生成和多粒度评估方法进一步提升了模型的推理精度，在多个视觉推理基准测试中表现出色。

AI项目与工具 2025年06月12日 98 点赞 0 评论 618 浏览

MMedAgent

MMedAgent是一款面向医疗领域的多模态AI平台，集成了指令优化的多模态大型语言模型（MLLM）及一系列定制化医疗工具，支持多种医学成像模式（如MRI、CT、X射线等），可高效处理视觉问答、分类、定位、分割、医学报告生成（MRG）及检索增强生成（RAG）等任务，显著提升了医疗数据处理效率与准确性。

AI项目与工具 2025年06月12日 45 点赞 0 评论 569 浏览

LlamaV

LlamaV-o1是由阿联酋穆罕默德·本·扎耶德人工智能大学等机构开发的多模态视觉推理模型，具备结构化推理和透明性，支持文本、图像和视频等多种模态的信息处理。该模型引入了VRC-Bench基准测试，涵盖4000多个推理步骤，用于全面评估推理能力。其性能优于多个开源模型，适用于医疗影像分析、金融数据解读、教育辅助和工业检测等场景，具有高准确性和可解释性。

AI项目与工具 2025年06月12日 74 点赞 0 评论 598 浏览

MVoT

MVoT是一种多模态推理框架，通过生成图像形式的推理痕迹，增强多模态大语言模型在复杂空间推理任务中的表现。其核心技术包括多模态推理范式、token discrepancy loss以及递归生成机制，有效提升推理准确性和可解释性。该工具适用于机器人导航、自动驾驶、智能教育、医疗影像分析及VR/AR交互等多个领域，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 57 点赞 0 评论 753 浏览

MedRAX

MedRAX是一款面向胸部X光检查的医学推理AI系统，结合多模态大模型与专业工具，实现复杂医疗问题的动态处理。支持多步骤推理、精准诊断与多种影像分析功能，适用于临床支持、教育培训及远程医疗等场景。系统具备良好的扩展性与部署灵活性，已在多项基准测试中表现优异。

AI项目与工具 2025年06月12日 68 点赞 0 评论 594 浏览

VLM

VLM-R1 是由 Om AI Lab 开发的视觉语言模型，基于 Qwen2.5-VL 架构，结合强化学习优化技术，具备精准的指代表达理解和多模态处理能力。该模型适用于复杂场景下的视觉分析，支持自然语言指令定位图像目标，并在跨域数据中表现出良好的泛化能力。其应用场景涵盖智能交互、无障碍辅助、自动驾驶、医疗影像分析等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 770 浏览

Skywork R1V

Skywork R1V是昆仑万维推出的首个工业级多模态思维链推理模型，具备强大的视觉链式推理能力，可处理数学问题、科学现象分析、医学影像诊断等复杂任务。其技术基于文本推理能力的多模态迁移与混合式训练方法，在多项基准测试中表现优异。模型开源，适用于教育、医疗、科研、内容审核等多个领域，推动多模态人工智能的发展。

AI项目与工具 2025年06月12日 80 点赞 0 评论 896 浏览

美亚影擎

美亚影擎是美亚光电联合影擎推出的口腔影像智能体，集成先进成像技术和智能算法，为口腔医生提供高清晰度的口腔影像，提升诊断效率和准确性。其功能包括快速成像、智能分析、多模态影像解析、AI辅助诊断、患者管理以及设备协同等，支持与医疗信息系统集成，优化诊疗流程。同时具备自主监测、数据共享、持续升级等优势，适用于多种口腔临床场景。

AI项目与工具 2025年06月11日 66 点赞 0 评论 825 浏览

影像分析

首页

影像分析

列表

默认

浏览次数

发布日期