视频 - 智狐AI导航

LongVILA

LongVILA是一款专为长视频理解设计的视觉语言AI模型，由多家知名研究机构共同开发。它具备强大的长上下文处理能力和多模态序列并行性，能在大量GPU上高效训练，无需梯度检查点。LongVILA通过五阶段训练流程，结合大规模数据集构建和高性能推理，显著提升了长视频字幕的准确性和处理效率。此外，它还支持多种应用场景，包括视频字幕生成、内容分析、视频问答系统等。

AI项目与工具 2025年06月12日 52 点赞 0 评论 607 浏览

CustomCrafter

CustomCrafter是一个由腾讯和浙江大学合作开发的自定义视频生成框架，能够根据文本提示和参考图像生成高质量的个性化视频。该框架支持自定义主体身份和运动模式，具备文本提示生成视频、保留运动生成能力和概念组合能力等功能。其核心技术包括视频扩散模型、空间主题学习模块和动态加权视频采样策略等，广泛应用于影视制作、虚拟现实、游戏开发、广告营销和社交媒体内容创作等领域。

AI项目与工具 2025年06月12日 31 点赞 0 评论 865 浏览

LLaVA

LLaVA-OneVision是字节跳动开发的开源多模态AI模型，主要功能包括多模态理解、任务迁移、跨场景能力、开源贡献及高性能。该模型采用多模态架构，集成了视觉和语言信息，通过Siglip视觉编码器和Qwen-2语言模型，实现高效特征映射和任务迁移学习。广泛应用于图像和视频分析、内容创作辅助、聊天机器人、教育和培训以及安全监控等领域。

AI项目与工具 2025年06月12日 34 点赞 0 评论 887 浏览

Video

Video-LLaVA2是一款由北京大学ChatLaw课题组开发的开源多模态智能理解系统。该系统通过时空卷积（STC）连接器和音频分支，显著提升了视频和音频的理解能力。其主要功能包括视频理解、音频理解、多模态交互、视频问答和视频字幕生成。时空建模和双分支框架是其核心技术原理。Video-LLaVA2广泛应用于视频内容分析、视频字幕生成、视频问答系统、视频搜索和检索、视频监控分析及自动驾驶等领域。

AI项目与工具 2025年06月12日 50 点赞 0 评论 642 浏览

auto

Auto-Video-Generator是一款基于AI的自动解说视频生成工具，能够一键生成解说视频。通过输入主题，系统自动生成解说脚本、合成语音、生成配图并完成视频合成，大幅提高内容创作效率。该工具适用于自媒体、营销、教育、新闻媒体及社交媒体等多个领域，帮助用户快速制作高质量视频。

AI项目与工具 2025年06月12日 58 点赞 0 评论 865 浏览

CapCut

CapCut是一款由抖音开发的免费视频编辑软件，支持视频剪辑、音频编辑、字幕生成、滤镜应用及转场效果等多种功能。该软件界面友好，易于学习，适用于初学者和专业人士。它不仅可以在移动设备上使用，还支持PC端，便于用户跨平台编辑和分享视频。CapCut广泛应用于社交媒体内容创作、商业宣传、教育和培训以及个人项目。

AI项目与工具 2025年06月12日 24 点赞 0 评论 958 浏览

AniEraser是一款由万兴科技开发的AI去水印工具，支持PC和移动设备。它能够高效去除图片和视频中的水印、物体和文字，同时保持原始文件的清晰度和质量。该工具具有简洁友好的用户界面，支持批量处理和多格式文件导入导出，并能处理高分辨率文件。通过自定义画笔和AI技术，用户可以精确选择并移除不需要的元素。AniEraser适用于社交媒体内容制作、版权素材清理、个人照片编辑、视频内容创作以及广告和营销材

AI项目与工具 2025年06月12日 55 点赞 0 评论 968 浏览

mPLUG

mPLUG-Owl3是一款由阿里巴巴开发的多模态AI模型，专注于理解和处理多图及长视频内容。该模型具备高推理效率和准确性，采用创新的Hyper Attention模块优化视觉与语言信息的融合。它已在多个基准测试中展现出卓越性能，并且其源代码和资源已公开，可供研究和应用。

AI项目与工具 2025年06月12日 73 点赞 0 评论 663 浏览

TrackGo

TrackGo是一种先进的AI视频生成技术，利用自由形状的遮罩和箭头提供精确的运动控制。其核心技术TrackAdapter无缝集成到预训练的视频生成模型中，通过调整时间自注意力层来激活与运动相关的区域。TrackGo在视频质量、图像质量和运动忠实度方面表现出色，适用于影视制作、动画制作、虚拟现实（VR）、增强现实（AR）和游戏开发等多个领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 927 浏览

AutoShorts

AutoShorts是一个开源的AI视频创作和发布平台，它通过AI技术自动生成并定制视频内容，支持用户自定义脚本、配音和视觉效果。该平台可实现每日自动发布新视频到YouTube和TikTok，适用于内容创作者、社交媒体管理者、营销代理及教育机构。AutoShorts简化视频制作流程，提升工作效率，同时确保内容的独特性和创新性。

AI项目与工具 2025年06月12日 24 点赞 0 评论 883 浏览

视频

首页

视频

列表

默认

浏览次数

发布日期