长上下文处理

首页

长上下文处理

ChatDLM

ChatDLM是由Qafind Labs开发的高效扩散语言模型，结合区块扩散与专家混合技术，具备7B参数规模，推理速度达2800 tokens/s，支持131,072 tokens的超长上下文处理。其核心优势包括高效文本生成、可控生成与局部修复、资源高效性及动态优化能力。适用于多轮对话、实时情绪监测、长文档创作及学术研究等场景，支持垂直领域知识召回率提升至95.6%。

AI项目与工具 2025年06月11日 92 点赞 0 评论 713 浏览

Granite 4.0 Tiny Preview是IBM推出的轻量级语言模型，具备高效计算能力和紧凑结构，支持在消费级GPU上运行多个长上下文任务。采用混合Mamba-2/Transformer架构，结合高效与精准优势，支持无位置编码（NoPE）处理128K tokens上下文。内存需求降低72%，推理时仅激活1B参数，适用于边缘设备部署、长文本分析及企业级应用开发，适合资源受限环境下的AI研究与

AI项目与工具 2025年06月11日 42 点赞 0 评论 459 浏览

猎户星空大模型

百亿级模型SOTA，支持 32万 tokens 的上下文能够一次性接受并处理约 45 万汉字的输入内容准确提取关键信息。

创作工具 1970年01月01日 0 点赞 0 评论 700 浏览

长上下文处理 首页 长上下文处理

列表 默认 浏览次数 发布日期

ChatDLM

Granite 4.0 Tiny Preview

猎户星空大模型

长上下文处理

首页

长上下文处理

列表

默认

浏览次数

发布日期