图像描述 - 智狐AI导航

Aya Vision

Aya Vision 是 Cohere 推出的多模态、多语言视觉模型，支持 23 种语言，具备图像描述生成、视觉问答、文本翻译和多语言摘要生成等能力。采用模块化架构与合成标注技术，确保在资源有限条件下仍具高效表现。适用于教育、内容创作、辅助工具开发及多语言交流等多个场景，具有广泛的实用价值。

AI项目与工具 2025年06月12日 70 点赞 0 评论 596 浏览

DAM

DAM-3B是英伟达开发的多模态大语言模型，专用于图像和视频中特定区域的详细描述。支持点、边界框、涂鸦或掩码等方式指定目标区域，生成精准文本描述。其核心技术包括焦点提示与局部视觉骨干网络，有效融合全局与局部特征。DAM-3B-Video版本扩展至视频处理，适用于动态场景。模型基于Transformer架构，支持多模态输入，广泛应用于内容创作、智能交互及无障碍工具等领域。

AI项目与工具 2025年06月11日 56 点赞 0 评论 940 浏览

BuboGPT | 字节大模型

BuboGPT是由字节跳动开发的大型语言模型,能够处理多模态输入,包括文本、图像和音频,并具有将其响应与视觉对象相对应的独特能力。

Ai平台模型 2025年06月05日 99 点赞 0 评论 613 浏览

Bright Eye

Bright Eye是一款多功能的AI分析图像，可以生成文本、图像、代码、故事、诗歌的APP程序。

Ai图片处理 2025年06月05日 73 点赞 0 评论 721 浏览

图像描述

首页

图像描述

列表

默认

浏览次数

发布日期

Aya Vision

DAM

BuboGPT | 字节大模型

Bright Eye

图像描述 首页 图像描述

列表 默认 浏览次数 发布日期

Aya Vision

DAM

BuboGPT | 字节大模型

Bright Eye

图像描述

首页

图像描述

列表

默认

浏览次数

发布日期