模型 - 智狐AI导航

MagicMan

MagicMan是由多个顶尖研究机构联合开发的AI工具，主要功能是从单张2D图像生成高质量的3D人类模型。它结合了预训练的2D扩散模型和参数化的SMPL-X模型，并通过混合多视角注意力机制和迭代细化策略，实现精确的3D感知和图像生成。MagicMan在游戏、电影、虚拟现实、时尚、零售和教育等多个领域有广泛应用，能够显著提高角色设计的真实感和多样性。

AI项目与工具 2025年06月12日 55 点赞 0 评论 814 浏览

VideoDrafter

一个高质量视频生成的开放式扩散模型，相比之前的生成视频模型，VideoDrafter最大的特点是能在主体不变的基础上，一次性生成多个场景的视频。

Ai开源项目 2025年06月05日 89 点赞 0 评论 814 浏览

QwQ

QwQ-32B-Preview是一款由阿里巴巴开发的开源AI推理模型，具有325亿参数，擅长处理数学与编程领域的复杂任务。它能在多个基准测试中超越同类产品，并提供透明化的推理流程。然而，该模型在语言切换及跨领域应用上存在一定局限性。

AI项目与工具 2025年06月12日 99 点赞 0 评论 814 浏览

Mogao

Mogao是由字节跳动开发的多模态生成基础模型，结合双视觉编码器和先进位置嵌入技术，实现高质量的图像与文本生成。支持零样本图像编辑、多模态理解与生成、高分辨率图像输出以及优化的中文文本渲染。适用于内容创作、智能交互、医疗影像分析等多个领域，具备强大的跨模态处理能力和生成稳定性。

AI项目与工具 2025年06月11日 97 点赞 0 评论 814 浏览

广电运通望道大模型

广电运通望道大模型是一个多功能的人工智能平台，它通过集成的高级自然语言处理和数据分析能力，为用户提供了从文本分析到创意生成的一系列服务。

创作工具 2026年07月29日 0 点赞 0 评论 815 浏览

Migician

Migician是一款由多所高校联合开发的多模态大语言模型，专为多图像定位任务设计。它基于大规模数据集MGrounding-630k，采用端到端架构和两阶段训练方法，支持跨图像精准定位与多任务处理。Migician适用于自动驾驶、安防监控、医疗影像等多个领域，具有高效的推理能力和灵活的输入方式。

AI项目与工具 2025年06月12日 90 点赞 0 评论 815 浏览

Cline

Cline 是一款集成于 VSCode 的 AI 编程助手，支持代码生成、编辑、终端命令执行及 Web 开发调试。可连接多种语言模型，提供项目理解与任务执行能力，增强开发效率。具备安全交互机制和扩展功能，适用于全栈开发场景。

AI项目与工具 2025年06月12日 81 点赞 0 评论 815 浏览

LEOPARD

LEOPARD是一款由腾讯AI Lab开发的视觉语言模型，专为处理包含大量文本的多图像任务而设计。它通过自适应高分辨率多图像编码模块和大规模多模态指令调优数据集，实现对复杂视觉语言任务的高效处理，包括跨图像推理、高分辨率图像处理及动态视觉序列长度优化。LEOPARD在自动化文档理解、教育、商业智能等领域具有广泛应用潜力。

AI项目与工具 2025年06月12日 35 点赞 0 评论 815 浏览

SynthID Text

SynthID Text 是一种由谷歌DeepMind开发的文本水印技术，主要用于识别和验证大型语言模型生成的文本。它通过在生成过程中嵌入几乎不可见的水印，保持文本质量的同时实现高效检测。SynthID Text 支持多种模式，适用于新闻、教育、法律及社交媒体等多个领域，为内容验证和AI应用提供了技术支持。

AI项目与工具 2025年06月12日 50 点赞 0 评论 815 浏览

CausVid是一种由Adobe和MIT联合开发的实时视频生成技术，基于自回归生成模型和蒸馏预训练技术，实现了低延迟、高效率的视频创作。其核心功能包括即时视频生成、快速流式生成、零样本图像到视频转换、视频风格迁移、长视频生成以及交互式剧情生成等。CausVid通过分布匹配蒸馏、非对称蒸馏策略和滑动窗口机制等技术手段，优化了视频生成的质量与稳定性，适用于内容创作、新闻报道、教育培训、游戏开发及广告营

AI项目与工具 2025年06月12日 80 点赞 0 评论 815 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期