量化 - 智狐AI导航

MaxKB

MaxKB是一款开源AI知识库问答系统，支持文档上传、在线文档爬取、文本自动拆分和向量化。它兼容多种大语言模型，包括本地私有和公共模型，提供灵活的工作流引擎和多格式文档支持。MaxKB采用先进的技术如大型预训练语言模型、自动化文档处理、检索增强生成（RAG）技术和向量数据库技术，适用于企业内部知识库、客户服务、教育与培训等多个领域。

AI项目与工具 2025年06月12日 94 点赞 0 评论 822 浏览

Nemotron

Nemotron-Mini-4B-Instruct是一款由英伟达开发的小型开源语言模型，针对角色扮演、检索增强生成（RAG）及函数调用任务进行了优化。模型基于Transformer架构，利用蒸馏、剪枝和量化技术提升运行效率与设备端适配能力，适用于实时交互场景，如游戏NPC对话或虚拟助手交互。其快速响应特性使其在客户服务、教育软件及内容创作领域也展现出巨大潜力。

AI项目与工具 2025年06月12日 46 点赞 0 评论 816 浏览

Faster Whisper

Faster Whisper 是一款基于 OpenAI Whisper 模型的高效语音识别工具，利用 CTranslate2 引擎显著提升转写速度并降低内存消耗。它支持多语言处理，可应用于实时语音转写、视频字幕生成、客户服务、医疗记录等领域。其核心技术包括 8 位量化、语音活动检测（VAD）及模型优化，同时提供灵活的 API 接口供开发者集成。

AI项目与工具 2025年06月12日 30 点赞 0 评论 513 浏览

CatVTON

CatVTON是一款基于先进AI算法的虚拟试衣工具，能够将服装从一个人无缝转移到另一个人身上，同时保留服装细节的一致性。该工具采用轻量级网络架构，减少了计算资源的需求，无需复杂的预处理步骤，即可实现高效的服装试穿效果。CatVTON适用于电子商务、时尚设计、个性化推荐等多个领域，为用户提供了便捷且真实感强的虚拟试衣体验。

AI项目与工具 2025年06月12日 42 点赞 0 评论 567 浏览

概念股搜索器

概念股搜索器是一款利用向量搜索技术和自然语言处理的金融工具，能够将用户的自然语言描述与A股上市公司信息进行语义匹配，快速定位相关概念股。它支持关键词、意象及长句搜索，同时具备结果参考、用户反馈等功能。该工具适用于投资研究、热点追踪、策略开发以及教育学习等多个场景。

AI项目与工具 2025年06月12日 51 点赞 0 评论 675 浏览

Ministral 3B/8B

Ministral 3B 和 8B 是由 Mistral AI 开发的两款轻量级 AI 模型，专为设备端和边缘计算设计。它们具备强大的知识处理能力和高效的上下文管理能力，支持长达 128k 的上下文长度，并通过独特的交错滑动窗口注意力机制提升了推理速度。这些模型适用于设备端翻译、本地数据分析、智能助手及自主机器人等领域，同时支持无损量化和私有部署。

AI项目与工具 2025年06月12日 63 点赞 0 评论 808 浏览

DistilQwen2

DistilQwen2 是一款基于 Qwen2 大模型优化的轻量级语言模型，通过知识蒸馏技术提高运算效率并降低部署成本。其主要特点包括增强指令遵循能力、轻量级部署、高效运算及多语言支持。DistilQwen2 在知识蒸馏、任务感知课程规划、指令数据优化等方面进行了深入研究，并广泛应用于移动设备、边缘计算、客户服务、内容创作和教育技术等领域。

AI项目与工具 2025年06月12日 61 点赞 0 评论 690 浏览

BlueLM

BlueLM-V-3B是一种针对移动设备设计的多模态大型语言模型，结合了高效算法与系统优化，支持快速、低功耗的文本与图像处理。其主要特性包括多模态理解、实时响应、隐私保护、高效率部署及跨语言能力。该模型通过动态分辨率调整、批量图像编码及令牌下采样等技术，实现了在有限资源下的高性能表现。

AI项目与工具 2025年06月12日 62 点赞 0 评论 1009 浏览

DINO

DINO-X是一款由IDEA研究院开发的通用视觉大模型，具备开放世界对象检测与理解的能力。它支持多种提示类型，无需用户额外输入即可识别图像中的任意对象，并在多个基准测试中刷新了性能记录。DINO-X拥有Pro和Edge两个版本，分别针对高性能需求和边缘设备优化。其应用范围涵盖自动驾驶、智能安防、工业检测及机器人视觉等领域，助力行业创新与发展。

AI项目与工具 2025年06月12日 91 点赞 0 评论 686 浏览

Delta

Delta-CoMe是一种由清华大学NLP实验室牵头研发的增量压缩算法，它通过低秩分解与混合精度量化技术，显著减少了大型语言模型的存储和内存需求，同时保持了模型性能几乎无损。该工具支持多任务处理、推理加速，并广泛适用于云计算、边缘计算及学术研究等领域，特别擅长应对数学、代码和多模态任务。

AI项目与工具 2025年06月12日 58 点赞 0 评论 714 浏览

量化

首页

量化

列表

默认

浏览次数

发布日期