推理框架 - 智狐AI导航

MNN

MNN是一个由阿里巴巴开源的轻量级深度学习推理框架，支持多种模型格式和网络结构，具备高性能、低内存占用及跨平台特性。它通过模型量化、计算图优化和异构计算等技术，在移动设备和嵌入式系统中实现高效推理。主要功能涵盖模型转换、硬件加速、内存优化及多模型支持，广泛应用于图像识别、语音处理、智能家居及工业检测等领域。

AI项目与工具 2025年06月12日 76 点赞 0 评论 727 浏览

MedReason

MedReason是由多所高校联合开发的医学推理框架，通过知识图谱增强大型语言模型在医学领域的推理能力。其核心功能包括生成高质量推理数据、提升模型性能、确保医学准确性，并支持多种医学任务。MedReason采用医学实体提取、路径搜索、链式推理生成和质量过滤等技术，有效提升模型在复杂临床场景中的表现。项目提供开源代码、模型和论文，适用于医学问答、辅助诊断、教育培训及研究等领域。

AI项目与工具 2025年06月11日 21 点赞 0 评论 641 浏览

Gemma 3 QAT

Gemma 3 QAT 是谷歌推出的开源 AI 模型，采用量化感知训练技术，在降低显存需求的同时保持高性能。它支持多模态任务，具备 128,000-token 长上下文处理能力，并可在消费级 GPU 和边缘设备上运行。适用于视觉问答、文档分析、长文本生成等场景，同时兼容多种推理框架，便于部署。

AI项目与工具 2025年06月11日 44 点赞 0 评论 625 浏览

SearchAgent-X是由南开大学和伊利诺伊大学厄巴纳香槟分校（UIUC）研究人员开发的高效推理框架，旨在提升基于大型语言模型（LLM）的搜索Agent效率。通过高召回率的近似检索、优先级感知调度和无停顿检索等技术，显著提高系统吞吐量（1.3至3.4倍），降低延迟（降至原来的1/1.7至1/5），同时保持生成质量。该框架优化资源利用率，适用于智能客服、搜索引擎、企业知识管理等多种场景，为复杂A

AI项目与工具 2025年06月11日 56 点赞 0 评论 578 浏览

推理框架

首页

推理框架

列表

默认

浏览次数

发布日期

MNN

MedReason

Gemma 3 QAT

SearchAgent

推理框架 首页 推理框架

列表 默认 浏览次数 发布日期

MNN

MedReason

Gemma 3 QAT

SearchAgent

推理框架

首页

推理框架

列表

默认

浏览次数

发布日期