视频分析 - 智狐AI导航

OmAgent

OmAgent是由Om AI与浙江大学滨江研究院联合开发的多模态语言代理框架，支持文本、图像、视频等多种输入形式，简化设备端智能代理的开发流程。它具备高效模型集成、灵活算法接口和复杂任务处理能力，适用于视频监控、内容推荐、教育辅助等场景，提升设备智能化水平和用户体验。

AI项目与工具 2025年06月12日 97 点赞 0 评论 673 浏览

StreamBridge

StreamBridge是一款由苹果与复旦大学联合开发的端侧视频大语言模型框架，支持实时视频流的理解与交互。通过内存缓冲区和轮次衰减压缩策略，实现长上下文处理与主动响应。项目配套发布Stream-IT数据集，包含60万样本，适用于多种视频理解任务，展现出在视频交互、自动驾驶、智能监控等领域的应用前景。

AI项目与工具 2025年06月11日 41 点赞 0 评论 678 浏览

SynthID

SynthID是一款由DeepMind研发的技术工具，通过在AI生成的内容中嵌入数字水印来验证其真实性与原创性。它支持多种内容形式，包括文本、音乐、图像和视频，并具备良好的抗修改性和检测稳定性。SynthID不仅不影响内容质量，还提升了信息可信度，广泛应用于新闻、版权保护、教育、法律及社交媒体等领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 683 浏览

书生·万象InternVL 2.5

书生·万象InternVL 2.5是一款开源多模态大型语言模型，基于InternVL 2.0升级而来。它涵盖了从1B到78B不同规模的模型，支持多种应用场景，包括图像和视频分析、视觉问答、文档理解和信息检索等。InternVL 2.5在多模态理解基准上表现优异，性能超越部分商业模型，并通过链式思考技术提升多模态推理能力。

AI项目与工具 2025年06月12日 100 点赞 0 评论 718 浏览

VeoGo AI

VeoGo AI 是一款基于深度学习的短视频流量预测工具，可提前分析视频表现并提供优化建议，帮助创作者提升曝光与点击率。支持多平台算法适配，涵盖内容结构、画面构图、剪辑节奏、BGM选择等全方位优化指导，预测准确率超92%，适用于短视频创作与效率提升场景。

AI项目与工具 2025年06月11日 33 点赞 0 评论 722 浏览

澜舟智会

澜舟智会是一个由澜舟科技研发的会议内容分析平台，可以对你上传的会议音频和视频进行文字转录和深度智能分析。通过对分析结果的展示和交互，你可以对会议的关键信息进行快速的理...

创作工具 1970年01月01日 0 点赞 0 评论 731 浏览

LINER AI

Liner AI可以更智能、更快速地询问和学习任何事情。通过实时信息和参考资料即时获得答案。轻松消化任何网络文章和 YouTube 视频中的有用信息。

Ai办公效率 2025年06月05日 94 点赞 0 评论 746 浏览

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型，通过“扩展-压缩”策略优化处理高分辨率图像和长视频，兼具效率与准确性。它在图像和视频基准测试中表现优异，支持时间定位、机器人导航和医疗成像等应用场景，并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

AI项目与工具 2025年06月12日 68 点赞 0 评论 747 浏览

MM1.5

MM1.5是苹果公司研发的多模态大型语言模型，具备强大的文本与图像理解能力，包括视觉指代、定位及多图像推理功能。它通过数据驱动的训练方法，实现了从1B到30B参数规模的性能提升，并推出了视频和移动UI专用版本，为多模态AI技术发展提供重要参考。主要应用场景涵盖图像与视频理解、视觉搜索、辅助驾驶、智能助手及教育领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 751 浏览

日日新融合大模型

日日新融合大模型（SenseNova）是商汤科技推出的多模态AI系统，支持文本、图像、视频等多种数据的融合处理，具备强大的深度推理与多模态分析能力。该模型在多个权威评测中表现优异，广泛应用于自动驾驶、视频交互、办公教育、金融、园区管理及工业制造等领域，提升了多场景下的智能化水平。

AI项目与工具 2025年06月12日 88 点赞 0 评论 752 浏览

视频分析

首页

视频分析

列表

默认

浏览次数

发布日期