视频分析 - 智狐AI导航

热浪数据

短视频与直播电商一站式数据分析平台，提供抖音、小红书、视频号等社会化媒体平台数据分析服务。

数据分析 2025年06月05日 70 点赞 0 评论 914 浏览

InternVideo2.5

InternVideo2.5是一款由上海人工智能实验室联合多机构开发的视频多模态大模型，具备超长视频处理能力和细粒度时空感知。它支持目标跟踪、分割、视频问答等专业视觉任务，适用于视频检索、编辑、监控及自动驾驶等多个领域。模型通过多阶段训练和高效分布式系统实现高性能与低成本。

AI项目与工具 2025年06月12日 50 点赞 0 评论 826 浏览

NSFW Detector

NSFW Detector是一款基于深度学习的开源工具，利用Google的`vit-base-patch16-224-in21k`模型，能够在CPU环境中高效检测图像、PDF、视频及压缩包内的不适宜内容。该工具支持API集成与Docker部署，具备多CPU加速特性，可实现快速且安全的本地化内容分类，广泛应用于社交媒体、内容共享平台、企业网络等多个领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 823 浏览

DAM

DAM-3B是英伟达开发的多模态大语言模型，专用于图像和视频中特定区域的详细描述。支持点、边界框、涂鸦或掩码等方式指定目标区域，生成精准文本描述。其核心技术包括焦点提示与局部视觉骨干网络，有效融合全局与局部特征。DAM-3B-Video版本扩展至视频处理，适用于动态场景。模型基于Transformer架构，支持多模态输入，广泛应用于内容创作、智能交互及无障碍工具等领域。

AI项目与工具 2025年06月11日 56 点赞 0 评论 799 浏览

卡思数据

为视频内容创作者在节目创作和用户运营方面提供数据支持

数据分析 2025年06月05日 59 点赞 0 评论 796 浏览

AI课代表

专门为视频站打造的AI总结助手

Ai办公效率 1970年01月01日 0 点赞 0 评论 777 浏览

HumanOmni

HumanOmni 是一款面向人类中心场景的多模态大模型，融合视觉与听觉信息，具备情感识别、面部描述、语音理解等功能。基于大量视频与指令数据训练，采用动态权重调整机制，支持多模态交互与场景理解。适用于影视分析、教育、广告及内容创作等领域，具备良好的可扩展性和灵活性。

AI项目与工具 2025年06月12日 92 点赞 0 评论 770 浏览

FILM

Frame Interpolation是一个开源的神经网络模型，能够在两个视频帧之间生成高质量的中间帧，特别适合需要处理大范围场景运动的应用。

Ai视频生成 1970年01月01日 0 点赞 0 评论 757 浏览

日日新融合大模型

日日新融合大模型（SenseNova）是商汤科技推出的多模态AI系统，支持文本、图像、视频等多种数据的融合处理，具备强大的深度推理与多模态分析能力。该模型在多个权威评测中表现优异，广泛应用于自动驾驶、视频交互、办公教育、金融、园区管理及工业制造等领域，提升了多场景下的智能化水平。

AI项目与工具 2025年06月12日 88 点赞 0 评论 752 浏览

MM1.5

MM1.5是苹果公司研发的多模态大型语言模型，具备强大的文本与图像理解能力，包括视觉指代、定位及多图像推理功能。它通过数据驱动的训练方法，实现了从1B到30B参数规模的性能提升，并推出了视频和移动UI专用版本，为多模态AI技术发展提供重要参考。主要应用场景涵盖图像与视频理解、视觉搜索、辅助驾驶、智能助手及教育领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 751 浏览

视频分析

首页

视频分析

列表

默认

浏览次数

发布日期