SearchAgent SearchAgent-X是由南开大学和伊利诺伊大学厄巴纳香槟分校(UIUC)研究人员开发的高效推理框架,旨在提升基于大型语言模型(LLM)的搜索Agent效率。通过高召回率的近似检索、优先级感知调度和无停顿检索等技术,显著提高系统吞吐量(1.3至3.4倍),降低延迟(降至原来的1/1.7至1/5),同时保持生成质量。该框架优化资源利用率,适用于智能客服、搜索引擎、企业知识管理等多种场景,为复杂A AI项目与工具 2025年06月11日 56 点赞 0 评论 167 浏览
Gemma 3 QAT Gemma 3 QAT 是谷歌推出的开源 AI 模型,采用量化感知训练技术,在降低显存需求的同时保持高性能。它支持多模态任务,具备 128,000-token 长上下文处理能力,并可在消费级 GPU 和边缘设备上运行。适用于视觉问答、文档分析、长文本生成等场景,同时兼容多种推理框架,便于部署。 AI项目与工具 2025年06月11日 44 点赞 0 评论 261 浏览
MedReason MedReason是由多所高校联合开发的医学推理框架,通过知识图谱增强大型语言模型在医学领域的推理能力。其核心功能包括生成高质量推理数据、提升模型性能、确保医学准确性,并支持多种医学任务。MedReason采用医学实体提取、路径搜索、链式推理生成和质量过滤等技术,有效提升模型在复杂临床场景中的表现。项目提供开源代码、模型和论文,适用于医学问答、辅助诊断、教育培训及研究等领域。 AI项目与工具 2025年06月11日 21 点赞 0 评论 242 浏览
MNN MNN是一个由阿里巴巴开源的轻量级深度学习推理框架,支持多种模型格式和网络结构,具备高性能、低内存占用及跨平台特性。它通过模型量化、计算图优化和异构计算等技术,在移动设备和嵌入式系统中实现高效推理。主要功能涵盖模型转换、硬件加速、内存优化及多模型支持,广泛应用于图像识别、语音处理、智能家居及工业检测等领域。 AI项目与工具 2025年06月12日 76 点赞 0 评论 351 浏览