量化 - 智狐AI导航

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型，通过“扩展-压缩”策略优化处理高分辨率图像和长视频，兼具效率与准确性。它在图像和视频基准测试中表现优异，支持时间定位、机器人导航和医疗成像等应用场景，并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

AI项目与工具 2025年06月12日 68 点赞 0 评论 833 浏览

SVDQuant

SVDQuant是一种由MIT研究团队开发的后训练量化技术，专注于通过4位量化减少扩散模型的内存占用和推理延迟。它利用低秩分支技术吸收量化异常值，支持DiT和UNet架构，并能无缝集成LoRAs。SVDQuant适用于移动设备、个人电脑、云计算平台及低功耗设备，可大幅提升图像生成和处理效率。

AI项目与工具 2025年06月12日 76 点赞 0 评论 824 浏览

MaxKB

MaxKB是一款开源AI知识库问答系统，支持文档上传、在线文档爬取、文本自动拆分和向量化。它兼容多种大语言模型，包括本地私有和公共模型，提供灵活的工作流引擎和多格式文档支持。MaxKB采用先进的技术如大型预训练语言模型、自动化文档处理、检索增强生成（RAG）技术和向量数据库技术，适用于企业内部知识库、客户服务、教育与培训等多个领域。

AI项目与工具 2025年06月12日 94 点赞 0 评论 822 浏览

Nemotron

Nemotron-Mini-4B-Instruct是一款由英伟达开发的小型开源语言模型，针对角色扮演、检索增强生成（RAG）及函数调用任务进行了优化。模型基于Transformer架构，利用蒸馏、剪枝和量化技术提升运行效率与设备端适配能力，适用于实时交互场景，如游戏NPC对话或虚拟助手交互。其快速响应特性使其在客户服务、教育软件及内容创作领域也展现出巨大潜力。

AI项目与工具 2025年06月12日 46 点赞 0 评论 816 浏览

KTransformers是一款由清华大学KVCache.AI团队与趋境科技联合开发的开源工具，用于提升大语言模型的推理性能并降低硬件门槛。它支持在24GB显卡上运行671B参数模型，利用MoE架构和异构计算策略实现高效推理，预处理速度达286 tokens/s，推理速度达14 tokens/s。项目提供灵活的模板框架，兼容多种模型，并通过量化和优化技术减少存储需求，适合个人、企业及研究场景使用。

AI项目与工具 2025年06月12日 21 点赞 0 评论 812 浏览

Ministral 3B/8B

Ministral 3B 和 8B 是由 Mistral AI 开发的两款轻量级 AI 模型，专为设备端和边缘计算设计。它们具备强大的知识处理能力和高效的上下文管理能力，支持长达 128k 的上下文长度，并通过独特的交错滑动窗口注意力机制提升了推理速度。这些模型适用于设备端翻译、本地数据分析、智能助手及自主机器人等领域，同时支持无损量化和私有部署。

AI项目与工具 2025年06月12日 63 点赞 0 评论 809 浏览

TradingAgents

TradingAgents是由加州大学洛杉矶分校与麻省理工学院联合开发的多代理LLM金融交易框架，整合多种专业角色的AI代理，通过辩论与对话进行交易决策。该系统支持多类型市场数据分析，具备风险控制、动态调整与高可解释性，适用于量化交易、资产管理、个人投资等多个场景，显著提升交易效率与透明度。

AI项目与工具 2025年06月12日 24 点赞 0 评论 808 浏览

猎户星空大模型

百亿级模型SOTA，支持 32万 tokens 的上下文能够一次性接受并处理约 45 万汉字的输入内容准确提取关键信息。

创作工具 2026年06月29日 0 点赞 0 评论 767 浏览

Bamba

Bamba-9B是一种基于Mamba2架构的解码型语言模型，专注于提升大型语言模型的推理效率，尤其擅长处理长文本。它通过恒定的KV-cache设计解决了内存带宽瓶颈问题，并在多个开源平台上得到支持。Bamba-9B不仅具有高效的吞吐量和低延迟的特点，还支持模型量化及长上下文长度扩展，适用于多种应用场景，包括机器翻译、智能客服、内容推荐、自动摘要和社会媒体监控等。

AI项目与工具 2025年06月12日 26 点赞 0 评论 755 浏览

PaliGemma 2

PaliGemma 2是一款由Google DeepMind研发的视觉语言模型（VLM），结合了SigLIP-So400m视觉编码器与Gemma 2语言模型，支持多种分辨率的图像处理。该模型具备强大的知识迁移能力和出色的学术任务表现，在OCR、音乐乐谱识别以及医学图像报告生成等方面实现了技术突破。它能够处理多模态任务，包括图像字幕生成、视觉推理等，并支持量化和CPU推理以提高计算效率。

AI项目与工具 2025年06月12日 10 点赞 0 评论 754 浏览

量化

首页

量化

列表

默认

浏览次数

发布日期