模型训练 - 智狐AI导航

ModelEngine

ModelEngine 是华为开源的全流程 AI 开发工具链，涵盖数据处理、模型训练与应用开发三大核心模块。支持多模态数据清洗、知识向量化及模型推理，提供低代码编排和 RAG 框架，适用于医疗、金融、制造等领域的 AI 应用开发与行业化落地。

AI项目与工具 2025年06月12日 75 点赞 0 评论 536 浏览

Uthana

Uthana是一款基于AI的3D角色动画生成平台，支持通过文字描述、参考视频或动作库快速生成逼真动画。其核心功能包括动作搜索、骨骼适配、风格迁移、API集成等，适用于游戏开发、影视制作、虚拟角色设计等多个领域。平台提供灵活的输出格式和编辑工具，帮助用户高效完成动画创作。

AI项目与工具 2025年06月12日 62 点赞 0 评论 525 浏览

OLMo 2 32B

OLMo 2 32B 是由 Allen Institute for AI 推出的开源语言模型，拥有 320 亿参数，性能接近更大规模模型。它采用三阶段训练策略，结合预训练、中期训练和后训练，提升模型稳定性与任务适应性。模型支持多任务处理，涵盖自然语言处理、数学推理、编程辅助和内容创作等领域，并具备高效训练能力与低能耗优势。所有数据、代码和权重均开源，便于研究与开发。

AI项目与工具 2025年06月12日 87 点赞 0 评论 677 浏览

wcplusPro

wcplusPro 是一款支持多平台的微信公众号数据采集与分析工具，可采集文章、阅读数据等信息，并支持百万级数据管理与快速检索。提供多种数据导出格式，适用于 AI 训练、内容分析、市场研究等场景。具备数据报告、全文搜索、任务管理等功能，满足不同用户的多样化需求。

AI项目与工具 2025年06月12日 29 点赞 0 评论 592 浏览

TokenFD是由上海交通大学与美团联合开发的细粒度图文对齐基础模型，专为文档理解任务设计。通过图像与语言Token的统一特征空间对齐，支持Token级图文交互，提升了多模态任务性能。其基于自研的TokenIT数据集进行训练，涵盖2000万张图像和18亿高质量Token-Mask对，覆盖多种文本图像类型。TokenFD可用于文档处理、图像审查、文字检索及大模型知识增强等多个领域，具有广泛的适用性和

AI项目与工具 2025年06月12日 90 点赞 0 评论 679 浏览

Liquid

Liquid是由华中科技大学、字节跳动和香港大学联合开发的多模态生成框架，通过VQGAN将图像编码为离散视觉token并与文本共享词汇空间，使大型语言模型无需修改结构即可处理视觉任务。该框架降低训练成本，提升视觉生成与理解性能，并在多模态任务中表现出色。支持图像生成、视觉问答、多模态融合等应用，适用于创意设计、内容创作及智能交互等领域。

AI项目与工具 2025年06月12日 82 点赞 0 评论 601 浏览

MiniMind

MiniMind 是一款轻量级开源语言模型项目，具备极低的训练成本和高效的训练流程。其最小模型仅需 25.8M 参数，可在普通 GPU 上运行，支持多模态能力，如视觉语言模型 MiniMind-V。项目提供完整的训练代码，涵盖预训练、微调、LoRA、DPO 和模型蒸馏，兼容主流框架，适合初学者和开发者快速上手并应用于多个领域。

AI项目与工具 2025年06月12日 77 点赞 0 评论 823 浏览

Profiling Data

Profiling Data是DeepSeek开发的开源性能分析工具，基于PyTorch Profiler收集程序运行数据，用于优化深度学习模型的训练和推理效率。它支持可视化分析，可定位性能瓶颈、分析资源利用情况、优化通信策略，并适用于分布式系统调优。通过提供详细的运行指标，帮助开发者提升计算与通信效率，实现更高效的系统性能。

AI项目与工具 2025年06月12日 34 点赞 0 评论 993 浏览

EPLB

EPLB是DeepSeek推出的专家并行负载均衡工具，用于优化大规模模型训练中的资源分配。它通过冗余专家策略和分层/全局负载均衡机制，提升GPU利用率和训练效率。支持多层MoE模型，减少通信开销，适应不同场景需求。

AI项目与工具 2025年06月12日 10 点赞 0 评论 559 浏览

unsloth

Unsloth 是一款高效开源的LLM微调工具，通过优化计算流程和GPU内核设计，大幅提升训练速度并降低内存占用。支持多种主流大模型，提供动态量化、长上下文支持等功能，适用于学术研究、企业应用及资源受限环境中的模型优化。

AI项目与工具 2025年06月12日 44 点赞 0 评论 942 浏览

模型训练

首页

模型训练

列表

默认

浏览次数

发布日期