模型 - 智狐AI导航

UI

UI-TARS是由字节跳动开发的图形用户界面代理模型，支持通过自然语言实现桌面、移动端和网页的自动化交互。具备多模态感知、跨平台操作、视觉识别、任务规划与记忆管理等功能，适用于自动化任务执行和复杂交互场景。支持云端与本地部署，提供丰富的开发接口，便于集成与扩展。

AI项目与工具 2025年06月12日 33 点赞 0 评论 822 浏览

Zero123

一种从单个图像到一致的多视图扩散基础模型，旨在使用单视图输入生成 3D 一致的多视图图像。

Ai开源项目 2025年06月05日 19 点赞 0 评论 821 浏览

OpenAI o4

OpenAI o4-mini 是一款高性能、低成本的小型推理模型，专为快速处理数学、编程和视觉任务优化。它具备多模态能力，可结合图像与文本进行推理，并支持工具调用以提高准确性。在多项基准测试中表现优异，尤其在数学和编程领域接近完整版模型。适用于教育、数据分析、软件开发及内容创作等多个场景，是高效率与性价比兼备的AI工具。

AI项目与工具 2025年06月11日 27 点赞 0 评论 821 浏览

Gemini Robotics

Gemini Robotics 是谷歌 DeepMind 基于 Gemini 2.0 开发的机器人系统，融合视觉-语言-动作模型，支持复杂任务执行与环境适应。具备三维空间理解、物体检测、轨迹预测和开放词汇指令执行能力，适用于工业制造、物流仓储、家庭服务、医疗健康等多个领域。系统通过数据驱动训练，结合真实操作与多模态信息，实现高效、灵活的机器人控制。

AI项目与工具 2025年06月12日 17 点赞 0 评论 820 浏览

Llama 4 是 Meta 推出的多模态 AI 模型系列，采用混合专家（MoE）架构，提升计算效率。包含 Scout 和 Maverick 两个版本，分别适用于不同场景。Scout 支持 1000 万 token 上下文，Maverick 在图像理解和创意写作方面表现优异。Llama 4 支持 200 种语言，具备强大的语言生成与多模态处理能力，适用于对话系统、文本生成、代码辅助、图像分析等多个

AI项目与工具 2025年06月12日 46 点赞 0 评论 820 浏览

OmniVision

OmniVision是一款面向边缘设备的紧凑型多模态AI模型，参数量为968M。它基于LLaVA架构优化，能够处理视觉与文本输入，显著降低计算延迟和成本。OmniVision支持视觉问答、图像描述等功能，广泛应用于内容审核、智能助手、视觉搜索等领域。

AI项目与工具 2025年06月12日 37 点赞 0 评论 820 浏览

DeepSeek V3

DeepSeek V3是一款由幻方量化旗下的深度求索公司开源的AI模型，拥有6850亿参数，采用混合专家架构。它在多语言编程、长文本处理和对话交互方面表现出色，能够生成高质量代码、优化现有代码、协助调试、生成文本、分析文本、润色文本，并支持自然对话和多轮对话。此外，它在多个基准测试中表现出色，包括编程、数学、推理等领域。

AI项目与工具 2025年06月12日 53 点赞 0 评论 819 浏览

MiniCPM 4.0

MiniCPM 4.0是面壁智能推出的高效端侧大模型，包含8B和0.5B两种参数规模。其采用创新稀疏架构和三值量化技术，实现模型体积缩小90%并保持高性能。自研CPM.cu推理框架在极限场景下可提升220倍速度，支持多种开源框架部署，并适配主流芯片。具备高效双频换挡机制、多平台适配和多种版本选择，适用于智能辅导、医疗辅助、客服、游戏剧情生成等场景。

AI项目与工具 2025年06月11日 59 点赞 0 评论 819 浏览

FramePack

FramePack 是斯坦福大学推出的开源 AI 视频生成模型，通过帧上下文打包和抗漂移采样技术，实现高效、稳定的视频生成。其仅需 6GB 显存即可运行，支持实时高清视频生成，具备灵活的调度策略，适用于多种应用场景，如短视频制作、游戏开发、教育与广告等，显著降低了视频生成的硬件门槛。

AI项目与工具 2025年06月11日 23 点赞 0 评论 819 浏览

SPRIGHT

SPRIGHT是由多所高校和机构联合开发的视觉-语言数据集，旨在提升文本到图像生成模型的空间一致性。通过重新描述约600万张图像，强化空间关系表达，如“左/右”、“上/下”等，显著提高图像生成的准确性。该数据集支持复杂场景的图像生成，并经过多维度评估验证其可靠性。SPRIGHT为视觉-语言模型的研究和应用提供了重要资源，广泛应用于图像生成、VR/AR、教育及科研等领域。

AI项目与工具 2025年06月12日 77 点赞 0 评论 818 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期

UI