视频处理 - 智狐AI导航

ReCapture

ReCapture是一种先进的视频处理技术，由谷歌与新加坡国立大学联合研发。它通过多视图扩散模型和点云渲染生成新视角视频，同时使用掩码视频微调技术优化视频质量，保留场景运动并补全不可见部分，广泛应用于电影制作、视频编辑、虚拟现实及新闻报道等领域。

AI项目与工具 2025年06月12日 55 点赞 0 评论 490 浏览

SAM 2.1

SAM 2.1是一款由Meta开发的先进视觉分割模型，支持图像和视频的实时分割处理。其核心功能包括用户交互式分割、多对象跟踪、数据增强以及遮挡处理等。通过引入Transformer架构和流式记忆机制，SAM 2.1显著提升了对复杂场景的理解能力。该工具具有广泛的应用场景，涵盖内容创作、医疗影像分析、自动驾驶等多个领域。

AI项目与工具 2025年06月12日 49 点赞 0 评论 864 浏览

Apollo

Apollo是一个由Meta和斯坦福大学合作研发的大型多模态模型，专注于视频内容的理解。其核心特性包括“Scaling Consistency”现象的应用、高效的视频理解评估基准ApolloBench、以及在处理长视频方面的卓越性能。Apollo模型家族涵盖多种规模，广泛应用于视频内容分析、搜索推荐、智能监控、自动驾驶及教育等领域。

AI项目与工具 2025年06月12日 16 点赞 0 评论 637 浏览

VMix

VMix是一款提升文本到图像生成美学质量的工具，通过解耦文本内容与美学描述，并引入细粒度美学标签，增强图像在色彩、光线、构图等方面的视觉表现。其核心技术为交叉注意力混合控制模块，可在不改变原有模型结构的情况下注入美学条件，保持图文一致性。VMix兼容多种扩散模型及社区模块，支持多源输入、高质量视频处理、实时直播与远程协作，广泛应用于电视直播、网络直播、现场活动及虚拟演播室等场景。

AI项目与工具 2025年06月12日 97 点赞 0 评论 486 浏览

VideoRefer

VideoRefer是由浙江大学与阿里达摩院联合开发的视频对象感知与推理系统，基于增强型视频大型语言模型，实现对视频中对象的细粒度理解与分析。其核心包括大规模视频数据集、多功能空间-时间编码器和全面评估基准，支持对象识别、关系分析、推理预测及多模态交互等功能，适用于视频剪辑、教育、安防、机器人控制和电商等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 632 浏览

SeedVR

SeedVR是由南洋理工大学与字节跳动联合开发的视频修复模型，采用移位窗口注意力机制和因果视频变分自编码器，实现高质量、高效率的视频修复。支持任意长度和分辨率的视频处理，生成具有真实感细节的修复结果，适用于影视修复、广告制作、监控视频优化等多个场景。其处理速度优于现有方法，具备良好的实用性与扩展性。

AI项目与工具 2025年06月12日 93 点赞 0 评论 730 浏览

星火纪要

星火纪要是科大讯飞推出的音视频处理平台，支持语音转录、内容总结、多语言翻译、数据分析等功能，适用于会议、访谈、销售、培训等场景。系统可快速生成会议纪要，角色分离准确率超95%，支持12种场景模板，提升工作效率与信息管理能力。

AI项目与工具 2025年06月12日 49 点赞 0 评论 657 浏览

SVFR

SVFR是一款由腾讯优图实验室与厦门大学联合开发的视频人脸修复框架，能够统一处理视频中的人脸修复、着色和缺失区域补全任务。基于Stable Video Diffusion模型，结合任务嵌入、统一潜在正则化等技术，提升修复精度与时间稳定性。适用于影视后期、网络视频制作及数字档案修复等领域，具有广泛的应用价值。

AI项目与工具 2025年06月12日 81 点赞 0 评论 504 浏览

FaceFancy

FaceFancy是一款集成AI换脸、图像编辑与创意生成功能的应用，支持照片和视频换脸、多种风格头像生成、年龄与性别变换、旧照修复及特效滤镜等功能，适用于创意娱乐、个人形象设计及社交分享等场景，提升用户创作体验。

AI项目与工具 2025年06月12日 27 点赞 0 评论 635 浏览

DynamicFace

DynamicFace是由小红书团队开发的视频换脸技术，结合扩散模型与时间注意力机制，基于3D面部先验知识实现高质量、一致性的换脸效果。通过四种精细的面部条件分解和身份注入模块，确保换脸后的人脸在不同表情和姿态下保持一致性。该技术适用于视频与图像换脸，广泛应用于影视制作、虚拟现实、社交媒体等内容创作领域，具备高分辨率生成能力和良好的时间连贯性。

AI项目与工具 2025年06月12日 84 点赞 0 评论 469 浏览

视频处理

首页

视频处理

列表

默认

浏览次数

发布日期