模型优化 - 智狐AI导航

SuperGPQA

SuperGPQA是由字节跳动豆包团队与M-A-P联合开发的知识推理基准测试集，覆盖285个研究生级学科，包含26529道题目。其核心功能是评估大语言模型的泛化能力和真实推理水平，42.33%的题目涉及数学计算或形式推理。该测试集采用专家与大语言模型协同构建的方式，确保题目质量，并涵盖STEM与非STEM领域，填补了长尾学科评估的空白。适用于模型性能评估、优化指导及跨学科研究等多种应用场景。

AI项目与工具 2025年06月12日 11 点赞 0 评论 783 浏览

DualPipe

DualPipe是由DeepSeek开发的开源双向流水线并行技术，通过将前向和反向计算分离为独立管道并行执行，显著提升大规模深度学习模型的训练效率。该技术优化了计算与通信的重叠，降低内存峰值，提高资源利用率，并支持多模态处理、多任务学习等应用场景。适用于需要高效训练和推理的AI系统。

AI项目与工具 2025年06月12日 92 点赞 0 评论 787 浏览

DistilQwen2.5

DistilQwen2.5-R1 是阿里巴巴推出的基于知识蒸馏技术的轻量级深度推理模型，包含多种参数量级，适用于资源受限环境。它具备高效计算、深度推理和高度适应性，支持文本生成、机器翻译、客户服务等多种任务。通过双阶段训练和认知轨迹适配框架，提升了小模型的推理能力，性能优于同类开源模型。

AI项目与工具 2025年06月12日 92 点赞 0 评论 788 浏览

Stable Diffusion 3

Stable Diffusion 3 是一款由 Stability AI 开发的先进文本到图像生成模型，通过改进的文本渲染能力、多主题提示支持、可扩展的参数量、图像质量提升及先进的架构技术，实现了高质量和多样性的图像生成。该模型在图像生成和文本理解方面取得了显著进展，并通过 Diffusion Transformer 架构和 Flow Matching 技术提升了模型效率和图像质量。

AI项目与工具 2024年01月01日 87 点赞 0 评论 788 浏览

KTransformers是一款由清华大学KVCache.AI团队与趋境科技联合开发的开源工具，用于提升大语言模型的推理性能并降低硬件门槛。它支持在24GB显卡上运行671B参数模型，利用MoE架构和异构计算策略实现高效推理，预处理速度达286 tokens/s，推理速度达14 tokens/s。项目提供灵活的模板框架，兼容多种模型，并通过量化和优化技术减少存储需求，适合个人、企业及研究场景使用。

AI项目与工具 2025年06月12日 21 点赞 0 评论 804 浏览

MHA2MLA

MHA2MLA是一种由多所高校与研究机构联合开发的数据高效微调方法，基于多头潜在注意力机制（MLA）优化Transformer模型的推理效率。通过Partial-RoPE和低秩近似技术，显著减少KV缓存内存占用，同时保持模型性能稳定。仅需少量数据即可完成微调，适用于边缘设备、长文本处理及模型迁移等场景，具备高兼容性和低资源消耗优势。

AI项目与工具 2025年06月12日 47 点赞 0 评论 822 浏览

无问芯穹

无问芯穹致力于提供卓越的AGI算力解决方案，以大模型能效优化工具包为核心，向下联动多家国产芯片公司，向上通过智算云服务、智算一体机多种方式服务大模型算法企业，协同算力、算法、生态推动行业大模型的高效落地，构建AGI时代的大模型基础设施。

AI服务商 2025年06月05日 69 点赞 0 评论 841 浏览

SigLIP 2

SigLIP 2 是 Google DeepMind 开发的多语言视觉-语言模型，具有强大的图像与文本对齐能力。它支持多种语言输入，具备零样本分类、图像-文本检索等功能，并通过 Sigmoid 损失函数和自监督学习技术提升训练效率与模型性能。其支持多种分辨率的变体，适用于文档理解、视觉问答及开放词汇任务。该模型基于 Vision Transformer 架构，具备良好的兼容性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 848 浏览

PixVerse V2.5

PixVerse V2.5是一款由爱诗科技开发的AI视频生成工具，其主要功能包括模型优化、提高生成速度、支持4K分辨率、Performance模式、运动笔刷、运镜控制以及文本内容生成。这些功能共同提升了视频创作的动态效果和专业度，使得用户能够更快地生成高质量视频内容。PixVerse V2.5支持多种语言界面，适用于创意视频制作、广告和营销、教育和培训、社交媒体内容以及游戏和动画制作等领域。

AI项目与工具 2025年06月12日 62 点赞 0 评论 855 浏览

LLM2LLM

LLM2LLM是一种基于教师-学生架构的迭代数据增强方法，通过生成针对性的合成数据提升语言模型在低数据量场景下的性能。该技术通过识别并强化模型预测错误的数据点，实现精准优化，同时控制数据质量和规模。适用于医学、法律、教育等数据稀缺领域，具有良好的可扩展性和实用性。

AI项目与工具 2025年06月12日 96 点赞 0 评论 862 浏览

模型优化

首页

模型优化

列表

默认

浏览次数

发布日期