Kimi Latest Kimi Latest是月之暗面推出的实时更新AI模型,支持128k上下文长度,可自动选择模型规模并优化成本。具备图像理解、自动上下文缓存和多模态处理能力,适用于聊天应用、内容创作及数据分析等多种场景,为开发者和用户提供稳定高效的AI解决方案。 AI项目与工具 2025年06月12日 38 点赞 0 评论 242 浏览
Granite 3.1 Granite 3.1是IBM推出的一款先进语言模型,具备强大的上下文处理能力和多语言支持功能。其核心特性包括扩展至128K tokens的上下文窗口、全新嵌入模型以及功能调用幻觉检测能力。该模型适用于客户服务自动化、内容创作、企业搜索、语言翻译及合规性检查等多种应用场景。 AI项目与工具 2025年06月12日 46 点赞 0 评论 241 浏览
ACE ACE是一款基于扩散Transformer架构的多模态图像生成与编辑工具,通过长上下文条件单元(LCU)和统一条件格式实现自然语言指令的理解与执行。它支持图像生成、编辑、多轮交互等多种任务,适用于艺术创作、媒体制作、广告设计、教育培训等多个领域,提供高效且灵活的视觉内容解决方案。 AI项目与工具 2025年06月12日 74 点赞 0 评论 201 浏览
Mooncake Mooncake是一个以KVCache为中心的分布式大模型推理架构,由Kimi联合清华大学等机构开源。它通过分离预填充和解码阶段,有效利用GPU集群的其他资源,显著提升推理吞吐量,降低算力消耗,同时保持低延迟。Mooncake支持长上下文处理、负载均衡及过载管理,适用于多种应用场景,包括自然语言处理、语音识别、搜索引擎优化等,推动大模型技术的高效应用。 AI项目与工具 2025年06月12日 57 点赞 0 评论 186 浏览
Gemini 2.0 Flash Thinking Gemini 2.0 Flash Thinking 是谷歌发布的一款推理增强型AI模型,具有高达百万tokens的长上下文窗口、可解释的推理过程、代码执行功能及多模态处理能力。它能够有效减少推理矛盾,提升输出结果的可靠性和一致性,广泛适用于教育、科研、内容创作、客户服务以及数据分析等多个领域。 AI项目与工具 2025年06月12日 33 点赞 0 评论 131 浏览
Granite 4.0 Tiny Preview Granite 4.0 Tiny Preview是IBM推出的轻量级语言模型,具备高效计算能力和紧凑结构,支持在消费级GPU上运行多个长上下文任务。采用混合Mamba-2/Transformer架构,结合高效与精准优势,支持无位置编码(NoPE)处理128K tokens上下文。内存需求降低72%,推理时仅激活1B参数,适用于边缘设备部署、长文本分析及企业级应用开发,适合资源受限环境下的AI研究与 AI项目与工具 2025年06月11日 42 点赞 0 评论 126 浏览
Kheish Kheish 是一款基于大型语言模型的开源多智能体协作平台,支持复杂任务的分解与处理。它通过多智能体工作流、模块化集成和反馈循环机制,实现任务的高效执行与优化。Kheish 可无缝接入外部模块,如文件系统、Shell 和向量存储,广泛应用于代码审计、法律文件分析、客户服务自动化、内容创作等领域。 AI项目与工具 2025年06月12日 50 点赞 0 评论 125 浏览