MiniRAG

简介：MiniRAG是由香港大学开发的检索增强生成（RAG）系统，专为资源受限环境下的小型语言模型（SLMs）优化。其核心在于语义感知的异构图索引和轻量级拓扑增强检索方法，能够在降低存储需求的同时实现高性能知识检索与推理。该工具适用于即时通讯、个人内容管理、本地文档检索及隐私敏感场景，具备良好的适应性和实用性，为边缘计算和低功耗设备提供高效解决方案。

AI小编 727 阅读 0 评论 79 点赞

项目地址

MiniRAG简介

MiniRAG是由香港大学开发的一种检索增强生成（RAG）系统，旨在支持在资源受限环境下高效运行小型语言模型（SLMs）。该系统依托两项核心技术：语义感知的异构图索引机制，将文本片段与命名实体结合，降低对复杂语义理解的依赖；以及轻量级拓扑增强检索方法，通过图结构实现高效的语义发现，无需依赖高级语言处理能力。实验表明，MiniRAG在性能上可媲美大型语言模型（LLMs），同时仅需25%的存储空间。该项目提供了全面的基准数据集，用于评估轻量级RAG系统在实际设备中的表现，推动了在资源有限场景下高效、私密的RAG系统发展。

MiniRAG的核心功能

高效知识检索：采用独特的异构图索引机制，快速准确地从大量数据中提取相关信息，为生成高质量回答提供支持。
轻量级模型兼容性：专为小型语言模型设计，在保持较高性能的同时显著减少计算和存储需求，适合资源受限设备。
多步骤推理能力：通过查询引导的推理路径发现机制，有效处理复杂任务，提升答案准确性。
多场景适应性：适用于即时通讯、个人内容管理、本地文档检索等多种应用，提供个性化信息处理服务。

MiniRAG的技术原理

语义感知的异构图索引机制：
- 文本块节点（Vc）：保留原始上下文，确保检索结果的相关性。
- 实体节点（Ve）：提取关键语义元素，用于锚定语义理解。
- 实体-实体连接（Eα）：捕捉命名实体之间的关系与结构。
- 实体-文本块连接（Eβ）：建立实体与其上下文之间的联系。
- 边的语义描述：由语言模型生成，增强图结构的语义表达。
轻量级拓扑增强检索方法：
- 查询语义映射：通过实体提取与嵌入模型，对齐查询与图数据。
- 查询驱动的推理路径发现：构建逻辑连贯的推理链。
- 拓扑增强的图检索：结合嵌入相似性与图结构进行精准检索。
- 文本块检索：基于实体-文本块连接提取相关文本。
- 融合增强生成：整合检索结果与答案节点，生成结构化输出。

MiniRAG项目信息

GitHub仓库：https://github.com/HKUDS/MiniRAG/
arXiv技术论文：https://arxiv.org/pdf/2501.06713

MiniRAG的应用场景

即时通讯：支持智能回复与历史记录检索。
个人内容管理：辅助笔记整理与日程提醒。
本地文档检索：整合多文档信息并生成摘要。
隐私敏感应用：保障医疗与金融数据安全。
边缘设备应用：适配智能手表、音箱等设备。

本文分类：AI项目与工具
本文标签：AI工具 RAG系统小型语言模型知识检索语义理解图结构隐私保护边缘计算自然语言处理轻量级模型
浏览次数：727 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/9442.html

评论列表共有 0 条评论

暂无评论