预训练模型

NeMo

NeMo 是一款基于 NVIDIA 技术的端到端云原生框架，专为生成式 AI 模型的设计与部署而打造。它具备模块化架构、多模态支持、优化算法及分布式训练能力，可应用于语音识别、自然语言处理、文本到语音转换、对话式 AI 等多个领域，同时支持预训练模型微调和端到端开发流程，为企业提供高效灵活的解决方案。

AI项目与工具 2025年06月12日 38 点赞 0 评论 674 浏览

3DIS

3DIS-FLUX是一种基于深度学习的多实例图像生成框架，采用两阶段流程：先生成场景深度图，再进行细节渲染。通过注意力机制实现文本与图像的精准对齐，无需额外训练即可保持高生成质量。适用于电商设计、创意艺术、虚拟场景构建及广告内容生成等领域，具备良好的兼容性和性能优势。

AI项目与工具 2025年06月12日 32 点赞 0 评论 684 浏览

ClearerVoice

ClearerVoice-Studio 是一个基于复数域深度学习算法的开源语音处理框架，集成了语音增强、分离及音视频说话人提取等功能。它通过先进的 FRCRN 和 MossFormer 系列模型，实现了高效的语音信号处理，并具备强大的预训练能力和灵活的接口设计。该框架广泛应用于智能助手、会议记录、电话会议、公共安全等领域，助力提升语音处理技术的实际应用价值。

AI项目与工具 2025年06月12日 81 点赞 0 评论 713 浏览

Amphion

Amphion是一款开源音频生成工具包，包含文本转语音（TTS）、歌声合成（SVS）、语音转换（VC）、歌声转换（SVC）、文本转音频（TTA）和文本转音乐（TTM）等功能。它支持多种神经声码器，并提供可视化模型架构，帮助用户快速掌握音频生成技术。通过统一框架和预训练模型，Amphion推动了音频生成领域的研究和应用发展。

AI项目与工具 2025年06月12日 63 点赞 0 评论 727 浏览

LinFusion

LinFusion 是一种创新的图像生成模型，基于线性注意力机制高效处理高分辨率图像生成任务。它在处理大量像素时保持计算复杂度线性增长，显著提高生成效率。LinFusion 支持零样本跨分辨率生成，并与预训练模型组件如 ControlNet 和 IP-Adapter 兼容。在单个 GPU 上，LinFusion 能够生成高达 16K 分辨率的图像，广泛应用于艺术创作、游戏设计、虚拟现实等领域。

AI项目与工具 2025年06月12日 96 点赞 0 评论 757 浏览

InstantID 是一种基于扩散模型的图像生成技术，专注于实现零次（zero-shot）身份保留（Identity-Preserving）的个性化图像合成。该技术允许用户仅使用一张面部图像，在多种风格中生成个性化的图像，同时确保高保真度。其主要功能包括个性化图像合成、身份特征保留、风格迁移、新视角合成、身份插值和多身份合成。InstantID 兼容预训练模型，无需额外微调即可实现灵活的图像生成。

AI项目与工具 2024年01月01日 56 点赞 0 评论 762 浏览

TrackGo

TrackGo是一种先进的AI视频生成技术，利用自由形状的遮罩和箭头提供精确的运动控制。其核心技术TrackAdapter无缝集成到预训练的视频生成模型中，通过调整时间自注意力层来激活与运动相关的区域。TrackGo在视频质量、图像质量和运动忠实度方面表现出色，适用于影视制作、动画制作、虚拟现实（VR）、增强现实（AR）和游戏开发等多个领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 767 浏览

PartCrafter

PartCrafter是一款先进的3D生成模型，能够从单张RGB图像中生成多个语义明确且几何形态各异的3D网格。通过组合潜在空间表示每个3D部件，并利用层次化注意力机制确保全局一致性。该模型基于预训练的3D网格扩散变换器（DiT），支持多部件联合生成、端到端生成和部件级编辑，适用于游戏开发、建筑设计、影视制作等多个领域。

AI项目与工具 2025年06月11日 66 点赞 0 评论 771 浏览

智谱AI

智谱AI开放平台，GPT人工智能模型，基于领先的千亿级多语言、多模态预训练模型，打造高效率、通用化的“模型即服务”AI开发新范式。

Ai平台模型 2025年06月05日 51 点赞 0 评论 804 浏览

Bark

Bark是一款开源的文本到音频转换模型，由Suno AI开发，能够生成逼真的多语言语音及多种音频类型，包括音乐和背景噪音，并支持非语言交流的声音。该模型提供预训练模型，适用于研究和商业用途。其主要功能涵盖文本到音频转换、多语言支持、音频多样性和非语言交流模拟。Bark在多语言内容创作、音频内容生成和非语言交流场景中具有广泛应用。

AI项目与工具 2025年06月12日 28 点赞 0 评论 804 浏览

预训练模型

首页

预训练模型

列表

默认

浏览次数

发布日期