训练 - 智狐AI导航

FaceChain

FaceChain是一个由阿里巴巴达摩院开发的开源AI生成框架，专为创建个人数字形象而设计。用户上传个人照片后，可生成独特且个性化的数字写真。该框架采用先进的机器学习技术，支持多风格写真生成、个性化训练、姿态控制和自定义提示词等功能，满足不同用户的多样化需求。

AI项目与工具 2024年01月01日 50 点赞 0 评论 538 浏览

SwiftBrush V2

SwiftBrush V2 是一款基于文本到图像的单步扩散模型，通过改进权重初始化、LoRA训练及夹紧CLIP损失等技术，实现了与多步Stable Diffusion模型相媲美的性能。它无需真实图像数据即可训练，显著提升了生成速度和图像质量，广泛应用于艺术创作、游戏开发、虚拟现实等领域。

AI项目与工具 2025年06月12日 21 点赞 0 评论 537 浏览

DRT

DRT-o1是一套由腾讯研究院开发的基于长链思考推理（CoT）技术的AI翻译模型，专门针对文学作品翻译设计，尤其擅长处理比喻和隐喻等复杂修辞手法。模型通过多智能体框架和迭代优化机制，显著提升了翻译质量和效率，同时具备强大的复杂语言结构处理能力。DRT-o1已在多个应用场景中展现出广泛潜力，包括文学翻译、跨文化交流、教育辅助以及多语言内容创作等领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 537 浏览

触手AI绘画-4090极速出图

可以免费使用的AI绘画工具！

Ai绘画生成 1970年01月01日 0 点赞 0 评论 536 浏览

HOVER

HOVER是一款由英伟达研发的1.5M参数量的小型模型，专注于人形机器人复杂动作的控制。其核心功能涵盖多模式控制、运动学位置跟踪、关节角度跟踪及统一命令空间设计，通过策略蒸馏与模拟训练实现高效技能迁移，广泛应用于导航、桌面操作、移动操作及远程操控等场景。

AI项目与工具 2025年06月12日 90 点赞 0 评论 534 浏览

Gen

Gen-3 Alpha是一款由Runway公司研发的AI视频生成模型，能够生成长达10秒的高清视频片段，支持文本到视频、图像到视频的转换，并具备精细的时间控制及多种高级控制模式。其特点在于生成逼真的人物角色、复杂的动作和表情，提供运动画笔、高级相机控制和导演模式等高级控制工具，确保内容的安全性和合规性。

AI项目与工具 2025年06月12日 93 点赞 0 评论 532 浏览

SynCD

SynCD是由卡内基梅隆大学与Meta联合开发的高质量合成训练数据集，用于提升文本到图像模型的定制化能力。它通过生成同一对象在不同视角、光照和背景下的图像，结合共享注意力机制和3D资产引导，确保对象一致性。该数据集支持无调优模型训练，提升图像质量和身份保持能力，广泛应用于个性化内容生成、创意设计、虚拟场景构建等领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 532 浏览

Eagle

Eagle是一个由英伟达开发的多模态大模型，专长于处理高分辨率图像，提高视觉问答和文档理解能力。该模型采用多专家视觉编码器架构，通过简单的特征融合策略实现图像内容的深入理解。Eagle模型已开源，适用于多个行业，具有高分辨率图像处理、多模态理解、多专家视觉编码器、特征融合策略和预对齐训练等特点。

AI项目与工具 2025年06月12日 38 点赞 0 评论 532 浏览

GLM

GLM-4-Flash是一款由智谱AI开发的免费大模型API，具备强大的多轮对话、多语言处理能力以及网页检索和代码执行等功能。它利用深度学习技术，尤其是Transformer架构，来实现高效的语言处理和生成。该工具广泛应用于客户服务、内容创作、语言翻译、教育辅助和编程辅助等多个领域，为用户提供了一个全面而高效的AI解决方案。

AI项目与工具 2025年06月12日 34 点赞 0 评论 532 浏览

Transfusion是由Meta公司开发的多模态AI模型，能够同时生成文本和图像，并支持图像编辑功能。该模型通过结合语言模型的下一个token预测和扩散模型，在单一变换器架构上处理混合模态数据。Transfusion在预训练阶段利用了大量的文本和图像数据，表现出强大的扩展性和优异的性能。其主要功能包括多模态生成、混合模态序列训练、高效的注意力机制、模态特定编码、图像压缩、高质量图像生成、文本生成

AI项目与工具 2025年06月12日 26 点赞 0 评论 532 浏览

训练

首页

训练

列表

默认

浏览次数

发布日期