GPU优化

Flux.1 Lite

Flux.1 Lite是一款轻量级AI图像生成模型，基于Transformer架构，通过参数优化和精度保持技术，在减少内存占用的同时提升运行速度。其主要功能包括高质量图像生成、资源优化、快速部署及广泛适用性，适用于个人创作、教育、游戏开发、数字艺术以及广告营销等多个领域。

AI项目与工具 2025年06月12日 38 点赞 0 评论 604 浏览

AdaCache

AdaCache是一种开源的自适应缓存技术，由Meta开发，用于加速AI视频生成。它通过动态调整计算资源和引入运动正则化策略，优化视频生成过程中的缓存决策，显著提升生成速度，同时保持视频质量。AdaCache无需重新训练即可轻松集成到现有模型中，并适用于多GPU环境，广泛应用于影视制作、视频编辑、在线平台及虚拟现实等领域。

AI项目与工具 2025年06月12日 96 点赞 0 评论 855 浏览

KTransformers是一款由清华大学KVCache.AI团队与趋境科技联合开发的开源工具，用于提升大语言模型的推理性能并降低硬件门槛。它支持在24GB显卡上运行671B参数模型，利用MoE架构和异构计算策略实现高效推理，预处理速度达286 tokens/s，推理速度达14 tokens/s。项目提供灵活的模板框架，兼容多种模型，并通过量化和优化技术减少存储需求，适合个人、企业及研究场景使用。

AI项目与工具 2025年06月12日 21 点赞 0 评论 804 浏览

unsloth

Unsloth 是一款高效开源的LLM微调工具，通过优化计算流程和GPU内核设计，大幅提升训练速度并降低内存占用。支持多种主流大模型，提供动态量化、长上下文支持等功能，适用于学术研究、企业应用及资源受限环境中的模型优化。

AI项目与工具 2025年06月12日 44 点赞 0 评论 942 浏览

FlashMLA

FlashMLA 是 DeepSeek 开发的开源 MLA 解码内核，针对 NVIDIA Hopper 架构 GPU 优化，提升可变长度序列处理效率。支持 BF16 精度、页式 KV 缓存及分块调度，内存带宽达 3000 GB/s，算力达 580 TFLOPS。适用于大语言模型推理和 NLP 任务，具备高性能与低延迟特性，支持快速部署与性能验证。

AI项目与工具 2025年06月12日 12 点赞 0 评论 705 浏览

EPLB

EPLB是DeepSeek推出的专家并行负载均衡工具，用于优化大规模模型训练中的资源分配。它通过冗余专家策略和分层/全局负载均衡机制，提升GPU利用率和训练效率。支持多层MoE模型，减少通信开销，适应不同场景需求。

AI项目与工具 2025年06月12日 10 点赞 0 评论 559 浏览

Gemma 3

Gemma 3 是谷歌推出的开源人工智能模型，支持多语言、多模态处理，具备文本、图像及短视频分析能力。提供多种模型尺寸，适配不同硬件环境，优化了单 GPU/TPU 性能，推理速度提升显著。内置图像安全分类器，增强内容安全性。支持多种开发工具和部署方式，适用于人脸识别、物体检测、智能助手、文本分析等场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 642 浏览

MT

MT-MegatronLM 是摩尔线程推出的开源混合并行训练框架，支持密集模型、多模态模型和 MoE 模型的高效训练。采用 FP8 混合精度、高性能算子库和集合通信库，提升 GPU 集群算力利用率。通过模型并行、数据并行和流水线并行技术，实现大规模语言模型的高效分布式训练，适用于科研、企业及定制化 AI 应用场景。

AI项目与工具 2025年06月12日 25 点赞 0 评论 731 浏览

FILM

Frame Interpolation是一个开源的神经网络模型，能够在两个视频帧之间生成高质量的中间帧，特别适合需要处理大范围场景运动的应用。

Ai视频生成 2026年06月27日 0 点赞 0 评论 837 浏览

GPU优化

首页

GPU优化

列表

默认

浏览次数

发布日期