跨场景能力

首页

跨场景能力

列表

默认

浏览次数

发布日期

LLaVA

LLaVA-OneVision是字节跳动开发的开源多模态AI模型，主要功能包括多模态理解、任务迁移、跨场景能力、开源贡献及高性能。该模型采用多模态架构，集成了视觉和语言信息，通过Siglip视觉编码器和Qwen-2语言模型，实现高效特征映射和任务迁移学习。广泛应用于图像和视频分析、内容创作辅助、聊天机器人、教育和培训以及安全监控等领域。

AI项目与工具 2025年06月12日 34 点赞 0 评论 842 浏览

跨场景能力 首页 跨场景能力

列表 默认 浏览次数 发布日期

LLaVA

跨场景能力

首页

跨场景能力

列表

默认

浏览次数

发布日期