R

Gemini Fullstack LangGraph Quickstart

Gemini Fullstack LangGraph Quickstart 是谷歌DeepMind推出的开源项目,旨在帮助开发者快速搭建基于 Google Gemini 2.5 和 LangGraph 的全栈智能研究助手。项目包含 React 前端和 LangGraph 后端,支持动态生成搜索查询、网络研究、反思推理、迭代优化搜索结果,并生成带有引用的综合答案。支持本地开发和 Docker 部署,

ARC实验室

ARC实验室,即腾讯ARC Lab,是腾讯PCG下属的一个研究中心,专注于探索和挑战智能媒体相关的前沿技术。该实验室被称为腾讯PCG的“侦察兵”和“特种兵”,代表着其在探索智能媒体技术领...

ChatGPT提示词社区

ChatGPT prompt是一个由学习者和教育者组成的社区,他们聚在一起分享知识,促进成长。会员可以创建和共享提示,这些提示被高度评价为有效的学习和易于使用。参与者可以学习新事物...

MeshPad

MeshPad 是一款基于草图输入的交互式 3D 网格生成与编辑工具,可将二维草图快速转化为高质量三维模型并支持实时修改。采用三角形序列表示和 Transformer 模型,实现高效、精准的网格生成与调整。通过推测性预测策略,提升计算效率,缩短编辑时间。生成的网格在精度上优于现有方法,适用于艺术设计、建筑设计和工业设计等多个领域。

Lovart-全球首个设计 Agent

Lovart:设计师的首个专业 AI 设计 Agent Lovart 是什么? Lovart 是 LiblibAI 为设计师量身打造的全球首个专业设计 Agent。它像一位经验丰富的设计师一样思考和执行设计任务,能够提供高水准的设计方案。通过自然的语言交互,用户可以快速调整设计的布局、颜色和构图。L

疯狂简报

一家领先的独立跨界内容营销和创新技术应用媒体平台

MHA2MLA

MHA2MLA是一种由多所高校与研究机构联合开发的数据高效微调方法,基于多头潜在注意力机制(MLA)优化Transformer模型的推理效率。通过Partial-RoPE和低秩近似技术,显著减少KV缓存内存占用,同时保持模型性能稳定。仅需少量数据即可完成微调,适用于边缘设备、长文本处理及模型迁移等场景,具备高兼容性和低资源消耗优势。

KTransformers

KTransformers是一款由清华大学KVCache.AI团队与趋境科技联合开发的开源工具,用于提升大语言模型的推理性能并降低硬件门槛。它支持在24GB显卡上运行671B参数模型,利用MoE架构和异构计算策略实现高效推理,预处理速度达286 tokens/s,推理速度达14 tokens/s。项目提供灵活的模板框架,兼容多种模型,并通过量化和优化技术减少存储需求,适合个人、企业及研究场景使用。

Nemotron

Nemotron-Mini-4B-Instruct是一款由英伟达开发的小型开源语言模型,针对角色扮演、检索增强生成(RAG)及函数调用任务进行了优化。模型基于Transformer架构,利用蒸馏、剪枝和量化技术提升运行效率与设备端适配能力,适用于实时交互场景,如游戏NPC对话或虚拟助手交互。其快速响应特性使其在客户服务、教育软件及内容创作领域也展现出巨大潜力。