训练 - 智狐AI导航

Arctic

Arctic是一款由云计算公司Snowflake的AI研究团队开发的高效且开源的企业级大型语言模型，拥有480亿参数。该模型采用混合专家模型（MoE）架构，结合了密集变换器（Dense Transformer）和128个专家的特点。Arctic在成本效益、训练效率和推理效率方面具有显著优势，特别适用于企业任务，例如SQL生成、编程和指令遵循。模型基于Apache 2.0许可发布，用户可以自由使用和

AI项目与工具 2024年01月01日 90 点赞 0 评论 754 浏览

CAVIA

CAVIA是一款由苹果、得克萨斯大学奥斯汀分校和谷歌联合研发的多视角视频生成框架。它通过单一输入图像生成多个时空一致的视频序列，并采用视角集成注意力模块增强视频的一致性和连贯性，支持用户精准控制相机运动。此外，CAVIA利用多种数据源进行联合训练，优化生成视频的质量和真实感，在虚拟现实、增强现实以及电影制作等领域具有重要价值。

AI项目与工具 2025年06月12日 76 点赞 0 评论 755 浏览

LinFusion

LinFusion 是一种创新的图像生成模型，基于线性注意力机制高效处理高分辨率图像生成任务。它在处理大量像素时保持计算复杂度线性增长，显著提高生成效率。LinFusion 支持零样本跨分辨率生成，并与预训练模型组件如 ControlNet 和 IP-Adapter 兼容。在单个 GPU 上，LinFusion 能够生成高达 16K 分辨率的图像，广泛应用于艺术创作、游戏设计、虚拟现实等领域。

AI项目与工具 2025年06月12日 96 点赞 0 评论 757 浏览

Artguru

Artguru是一款结合AI技术的在线艺术图像生成工具，支持文字到图像的转换及照片风格化处理，涵盖多种艺术风格，如现实主义、动漫、印象派等。用户可自定义风格特征并生成独特头像或艺术作品，适用于社交媒体、虚拟形象设计、艺术创作、数字营销等多个场景，同时为艺术教育和创意思维训练提供支持。

AI项目与工具 2025年06月12日 10 点赞 0 评论 762 浏览

InstantID

InstantID 是一种基于扩散模型的图像生成技术，专注于实现零次（zero-shot）身份保留（Identity-Preserving）的个性化图像合成。该技术允许用户仅使用一张面部图像，在多种风格中生成个性化的图像，同时确保高保真度。其主要功能包括个性化图像合成、身份特征保留、风格迁移、新视角合成、身份插值和多身份合成。InstantID 兼容预训练模型，无需额外微调即可实现灵活的图像生成。

AI项目与工具 2024年01月01日 56 点赞 0 评论 762 浏览

TrackGo

TrackGo是一种先进的AI视频生成技术，利用自由形状的遮罩和箭头提供精确的运动控制。其核心技术TrackAdapter无缝集成到预训练的视频生成模型中，通过调整时间自注意力层来激活与运动相关的区域。TrackGo在视频质量、图像质量和运动忠实度方面表现出色，适用于影视制作、动画制作、虚拟现实（VR）、增强现实（AR）和游戏开发等多个领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 766 浏览

PartCrafter

PartCrafter是一款先进的3D生成模型，能够从单张RGB图像中生成多个语义明确且几何形态各异的3D网格。通过组合潜在空间表示每个3D部件，并利用层次化注意力机制确保全局一致性。该模型基于预训练的3D网格扩散变换器（DiT），支持多部件联合生成、端到端生成和部件级编辑，适用于游戏开发、建筑设计、影视制作等多个领域。

AI项目与工具 2025年06月11日 66 点赞 0 评论 770 浏览

Genie Studio

Genie Studio 是一款面向具身智能的全链路开发平台，涵盖数据采集、模型训练、仿真评测和部署。支持多模态数据采集、高保真仿真环境、自动化评测及一键真机部署，适用于机器人研发、工业自动化、物流仓储和服务机器人等多种场景，提升开发效率与应用落地速度。

AI项目与工具 2025年06月11日 78 点赞 0 评论 771 浏览

Psi R0

Psi R0是一款基于强化学习的端到端具身模型，支持双灵巧手协同操作，具备多技能串联混训和跨物品、跨场景的泛化能力。通过仿真数据训练及技能优化，Psi R0能在复杂环境中完成长程任务，同时具备自主切换技能的功能，确保高成功率和鲁棒性。主要应用场景包括电商商品打包、工厂产线组装、服务业拣货打包及家居环境清洁整理。

AI项目与工具 2025年06月12日 18 点赞 0 评论 775 浏览

AnimateAnything

AnimateAnything是一项由浙江大学与北京航空航天大学联合研发的统一可控视频生成技术。它能够根据相机轨迹、文本提示及用户动作注释等多样化控制信号生成高质量视频，并通过多尺度特征融合网络将这些信号转化为逐帧光流进行精准引导。此外，为解决大范围运动带来的视频闪烁问题，该技术采用了基于频率的稳定模块，显著增强了视频的时间稳定性。主要应用于影视制作、虚拟现实、游戏开发以及教育培训等多个领域。

AI项目与工具 2025年06月12日 36 点赞 0 评论 776 浏览

训练

首页

训练

列表

默认

浏览次数

发布日期