GPU - 智狐AI导航

RightNow AI

RightNow AI 是一款专注于 CUDA 代码优化的 AI 工具，能够自动分析并提升 GPU 性能。它支持多种 NVIDIA GPU 架构，提供无服务器的性能分析服务，并允许用户通过自然语言指令生成高性能代码。适用于模型训练、科学计算、金融建模等多个领域，显著降低 GPU 编程门槛，提升计算效率。

AI项目与工具 2025年06月11日 46 点赞 0 评论 466 浏览

DAMODEL

DAMODEL是一个基于GPU算力的AI开发云平台，支持多种主流AI框架和高性能GPU配置，提供开箱即用的开发环境和便捷的数据管理功能。平台具备可视化操作界面、JupyterLab在线访问及多种预置模型，适用于大模型训练、深度学习、数据科学和图像处理等多种应用场景。

AI项目与工具 2025年06月11日 19 点赞 0 评论 718 浏览

欧派算力云

欧派算力云是一家提供AI算力服务的平台，主要功能包括大模型API接口、GPU容器实例和Serverless服务。其核心技术涵盖分布式算力网络与自研推理加速引擎，显著提升模型推理性能并降低成本。平台支持多模态模型调用，适用于AI推理、训练、云渲染及元宇宙等场景，提供灵活计费与自动化管理功能，助力企业高效部署AI应用。

AI项目与工具 2025年06月11日 97 点赞 0 评论 540 浏览

算了么

算了么是一款基于GPU资源共享的平台，用户可通过闲置算力参与科学计算并获取收益。平台具备智能调度、灵活控制、收益追踪等功能，适用于科研、游戏、气候模拟等多个领域。用户可随时开启或关闭任务，确保不影响日常使用，同时为科技进步贡献力量。

AI项目与工具 2025年06月12日 32 点赞 0 评论 618 浏览

MT

MT-MegatronLM 是摩尔线程推出的开源混合并行训练框架，支持密集模型、多模态模型和 MoE 模型的高效训练。采用 FP8 混合精度、高性能算子库和集合通信库，提升 GPU 集群算力利用率。通过模型并行、数据并行和流水线并行技术，实现大规模语言模型的高效分布式训练，适用于科研、企业及定制化 AI 应用场景。

AI项目与工具 2025年06月12日 25 点赞 0 评论 644 浏览

Gemma 3

Gemma 3 是谷歌推出的开源人工智能模型，支持多语言、多模态处理，具备文本、图像及短视频分析能力。提供多种模型尺寸，适配不同硬件环境，优化了单 GPU/TPU 性能，推理速度提升显著。内置图像安全分类器，增强内容安全性。支持多种开发工具和部署方式，适用于人脸识别、物体检测、智能助手、文本分析等场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 559 浏览

COMET

COMET是字节跳动开发的Mixture-of-Experts（MoE）模型优化系统，通过细粒度计算-通信重叠技术和自适应负载分配机制，显著提升分布式训练效率。它在大规模模型中实现单层1.96倍、端到端1.71倍的加速，具备强鲁棒性与泛化能力，支持多种硬件环境和并行策略，核心代码已开源并可无缝集成至主流训练框架。

AI项目与工具 2025年06月12日 12 点赞 0 评论 784 浏览

EPLB

EPLB是DeepSeek推出的专家并行负载均衡工具，用于优化大规模模型训练中的资源分配。它通过冗余专家策略和分层/全局负载均衡机制，提升GPU利用率和训练效率。支持多层MoE模型，减少通信开销，适应不同场景需求。

AI项目与工具 2025年06月12日 10 点赞 0 评论 484 浏览

DeepEP

DeepEP 是 DeepSeek 开发的开源 EP 通信库，专为混合专家模型（MoE）的训练和推理设计。它提供高吞吐、低延迟的 GPU 内核，支持 NVLink 和 RDMA 通信，优化了组限制门控算法，兼容 FP8 等低精度数据格式。适用于大规模模型训练、推理解码及高性能计算场景，具有良好的系统兼容性和网络优化能力。

AI项目与工具 2025年06月12日 43 点赞 0 评论 753 浏览

FlashMLA

FlashMLA 是 DeepSeek 开发的开源 MLA 解码内核，针对 NVIDIA Hopper 架构 GPU 优化，提升可变长度序列处理效率。支持 BF16 精度、页式 KV 缓存及分块调度，内存带宽达 3000 GB/s，算力达 580 TFLOPS。适用于大语言模型推理和 NLP 任务，具备高性能与低延迟特性，支持快速部署与性能验证。

AI项目与工具 2025年06月12日 12 点赞 0 评论 633 浏览

GPU

首页

GPU

列表

默认

浏览次数

发布日期