模型 - 智狐AI导航

NeMo

NeMo 是一款基于 NVIDIA 技术的端到端云原生框架，专为生成式 AI 模型的设计与部署而打造。它具备模块化架构、多模态支持、优化算法及分布式训练能力，可应用于语音识别、自然语言处理、文本到语音转换、对话式 AI 等多个领域，同时支持预训练模型微调和端到端开发流程，为企业提供高效灵活的解决方案。

AI项目与工具 2025年06月12日 38 点赞 0 评论 597 浏览

Pix2Gif

Pix2Gif是一个由微软研究院开发的基于运动引导的扩散模型，能够将静态图像转换成动态的GIF动画或视频。该模型通过运动引导的扩散过程实现图像到GIF的生成，并利用文本描述和运动幅度作为输入。Pix2Gif还引入了感知损失机制，确保生成的GIF帧在视觉上与原始图像保持一致性和连贯性。

AI项目与工具 2024年01月01日 30 点赞 0 评论 597 浏览

HunyuanPortrait

HunyuanPortrait是由腾讯Hunyuan团队联合多所高校推出的基于扩散模型的肖像动画生成工具。它能够根据一张肖像图片和视频片段，生成高度可控且逼真的动画，保持身份一致性并捕捉细微表情变化。该工具在时间一致性和泛化能力方面表现优异，适用于虚拟现实、游戏、人机交互等多个领域。

AI项目与工具 2025年06月11日 24 点赞 0 评论 598 浏览

Embodied Reasoner

Embodied Reasoner是由多家科研机构联合开发的具身交互推理模型，通过视觉搜索、推理与行动协同完成复杂任务。采用模仿学习、自我探索和自我修正三阶段训练方法，生成多样化思考过程，提升任务规划效率。在长时序任务中表现优异，减少重复搜索和逻辑错误。适用于智能家居、仓储物流、医疗辅助等多个场景，具备多模态交互和强推理能力。

AI项目与工具 2025年06月11日 88 点赞 0 评论 598 浏览

TANGLED

TANGLED是一种3D发型生成技术，可从多种风格和视角的图像中生成高质量发丝。其核心技术包括多视图线稿扩散框架与参数化后处理模块，支持复杂发型的细节修复。该工具具备文化包容性，适用于动画、AR及虚拟试妆等场景，提升发型设计效率与真实性。

AI项目与工具 2025年06月12日 71 点赞 0 评论 598 浏览

Rodin

Rodin是一款由影眸科技开发的AI驱动3D生成工具，专注于快速生成高质量的3D模型。它支持文本提示和图片输入生成3D资产，具备多视图融合、模型调整及材质生成等功能，适用于游戏开发、角色建模、虚拟现实等多种场景，同时兼顾生成效率与细节表现，但需进一步优化精度与数据集适应性。

AI项目与工具 2025年06月12日 56 点赞 0 评论 598 浏览

Agent

Agent-S 是一款基于图形用户界面（GUI）的人机交互自动化框架，通过经验增强的分层规划和代理-计算机接口（ACI），实现了复杂任务的自动化分解与执行。它结合多模态大型语言模型（MLLMs）进行推理和控制，并具备持续学习和跨操作系统通用性的特点，适用于办公自动化、网页交互、个人助理、客户服务和教育等多个场景。

AI项目与工具 2025年06月12日 50 点赞 0 评论 598 浏览

Step

覆盖了从个人使用到企业级应用的多个方面的多模态大模型。

创作工具 1970年01月01日 0 点赞 0 评论 599 浏览

Cosmos

Cosmos是由英伟达推出的生成式世界基础模型平台，支持自动驾驶和机器人领域的虚拟环境生成与训练。它能够根据文本、图像或视频输入生成高度仿真的虚拟世界状态，并提供高效的数据处理与安全机制。平台包含多个参数规模的模型，适用于不同性能需求的应用场景。Cosmos还支持开放模型许可，便于开发者进行定制化部署。其应用场景涵盖驾驶模拟、策略优化、复杂环境训练及工业数字孪生等。

AI项目与工具 2025年06月12日 48 点赞 0 评论 599 浏览

SynthLight

SynthLight是由耶鲁大学与Adobe Research联合开发的基于扩散模型的人像重照明工具，通过物理渲染引擎生成合成数据并结合多任务训练策略，实现高质量的光照效果生成。它能够根据环境光照图重新渲染人像，生成自然的高光、阴影和漫反射效果，并适用于摄影后期、虚拟场景、游戏开发及广告设计等多个领域，具备良好的泛化能力和实用性。

AI项目与工具 2025年06月12日 73 点赞 0 评论 599 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期