深度学习 - 智狐AI导航

World Labs

李飞飞联合创办的空间智能初创企业。World,Labs致力于构建能够感知、生成并与3D世界互动的大型世界模型，将AI模型从2D像素的平面提升到完整的3D世界。

Ai科技公司 2025年06月05日 68 点赞 0 评论 689 浏览

MagicMan

MagicMan是由多个顶尖研究机构联合开发的AI工具，主要功能是从单张2D图像生成高质量的3D人类模型。它结合了预训练的2D扩散模型和参数化的SMPL-X模型，并通过混合多视角注意力机制和迭代细化策略，实现精确的3D感知和图像生成。MagicMan在游戏、电影、虚拟现实、时尚、零售和教育等多个领域有广泛应用，能够显著提高角色设计的真实感和多样性。

AI项目与工具 2025年06月12日 55 点赞 0 评论 690 浏览

Ingredients

Ingredients是一款基于多身份图像与视频扩散Transformer的视频生成框架，支持多身份特征的高效整合与动态分配。其核心模块包括面部提取器、多尺度投影器和ID路由器，能够保持身份一致性并生成高质量视频内容。无需额外训练即可实现个性化视频制作，适用于娱乐、广告、教育等多个领域。

AI项目与工具 2025年06月12日 49 点赞 0 评论 692 浏览

Jodi

Jodi是由中国科学院计算技术研究所和中国科学院大学推出的扩散模型框架，基于联合建模图像域和多个标签域，实现视觉生成与理解的统一。它支持联合生成、可控生成和图像感知三种任务，利用线性扩散Transformer和角色切换机制，提升生成效率和跨领域一致性。Jodi使用Joint-1.6M数据集进行训练，包含20万张高质量图像和7个视觉域标签，适用于创意内容生成、多模态数据增强、图像编辑与修复等场景。

AI项目与工具 2025年06月11日 32 点赞 0 评论 693 浏览

Shallow Research

Shallow Research 是一种基于“小模型+大模型”架构的快速信息处理工具，能够在短时间内完成大量网页内容的搜索、整理和初步分析，适合需要高效获取信息和生成初步结论的场景，提升研究与决策效率。

AI项目与工具 2025年06月12日 22 点赞 0 评论 693 浏览

Enhance

Enhance-A-Video是一款由多所顶尖高校联合研发的视频生成增强算法，专注于提升AI生成视频的质量，特别是在对比度、清晰度及细节真实性方面具有显著优势。其核心技术基于时间注意力机制优化，无需额外训练即可高效提升视频效果，适用于视频创作、学术研究、在线平台等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 694 浏览

Reverb ASR

Reverb ASR是一款基于深度学习的开源自动语音识别与说话人分离工具，采用20万小时高质量英语语音数据训练，具备高精度语音转录能力，支持逐字稿控制及多种解码模式。其显著特点是擅长处理长时间语音内容，并在长篇幅识别任务中超越其他开源模型。Reverb ASR适用于播客、会议记录、法庭记录等多个应用场景，为用户提供灵活且高效的语音转文字解决方案。

AI项目与工具 2025年06月12日 55 点赞 0 评论 694 浏览

百度智能云一见

百度智能云一见是一款面向视觉领域的大型模型平台，通过先进的深度学习、多模态学习及自动化机器学习技术，降低了模型生产的成本并提高了训练效率。该平台支持端到端效果调优自动化、零代码AI技能编排以及云边协同，广泛应用于工业质检、安全生产监控、餐饮连锁管理和零售分析等领域，助力企业实现智能化转型。

AI项目与工具 2025年06月12日 23 点赞 0 评论 695 浏览

SimpleAR

SimpleAR是一款由复旦大学与字节跳动联合研发的纯自回归图像生成模型，采用简洁架构实现高质量图像生成。其通过“预训练-有监督微调-强化学习”三阶段训练方法，提升文本跟随能力与生成效果。支持文本到图像及多模态融合生成，兼容加速技术，推理速度快。适用于创意设计、虚拟场景构建、多模态翻译、AR/VR等多个领域。

AI项目与工具 2025年06月11日 76 点赞 0 评论 695 浏览

ModelScope

ModelScope被称为“魔搭社区”，是国内首个中文AI模型开源社区，由阿里巴巴通义实验室联合CCF开源发展委员会发起的模型开源社区及创新平台，旨在通过开放的社区合作，构建深度学习相关的模型开源社区，并开放给全球的开发者使用。

Ai平台模型 2025年06月05日 91 点赞 0 评论 696 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期