应用 - 智狐AI导航

CogAgent

CogAgent是一款由清华大学与智谱AI联合开发的多模态视觉大模型，专注于图形用户界面（GUI）的理解与导航。它具备视觉问答、视觉定位、GUI Agent、高分辨率图像处理及多模态能力，可应用于自动化测试、智能交互、多模态人工智能应用开发、企业级AI Agent平台等多个领域。CogAgent在多个基准测试中表现出色，尤其在GUI操作数据集上显著超越现有模型。

AI项目与工具 2025年06月12日 66 点赞 0 评论 691 浏览

EfficientTAM是一款由Meta AI研发的轻量级视频对象分割与跟踪模型，基于非层次化Vision Transformer（ViT）构建，通过引入高效记忆模块显著降低了计算复杂度。它能够实现高质量的视频对象分割与多目标跟踪，同时保持较低的延迟和较小的模型尺寸，特别适用于移动设备上的实时视频处理。该模型已在多个视频分割基准测试中表现出色，并支持多种应用场景，包括移动视频编辑、视频监控、增强现

AI项目与工具 2025年06月12日 65 点赞 0 评论 691 浏览

Promethean AI

Promethean AI 是世界上第一...

创作工具 2026年06月28日 0 点赞 0 评论 691 浏览

Bright Eye

Bright Eye是一款多功能的AI分析图像，可以生成文本、图像、代码、故事、诗歌的APP程序。

Ai图片处理 2025年06月05日 73 点赞 0 评论 692 浏览

Marco

Marco是一款由阿里国际研发的大规模商用翻译大模型，支持15种主流语种，具备基于语境的精准翻译能力。其核心功能包括多语种翻译支持、跨境电商优化、多样化风格翻译以及高并发处理能力。Marco采用深度学习技术，结合多语言数据筛选和参数扩展方法，确保翻译质量和效率。它广泛应用于商品信息本地化、多语言客户服务、跨境电商平台及个人文档翻译等领域，助力全球化沟通。

AI项目与工具 2025年06月12日 58 点赞 0 评论 692 浏览