视频

AdaCache

AdaCache是一种开源的自适应缓存技术,由Meta开发,用于加速AI视频生成。它通过动态调整计算资源和引入运动正则化策略,优化视频生成过程中的缓存决策,显著提升生成速度,同时保持视频质量。AdaCache无需重新训练即可轻松集成到现有模型中,并适用于多GPU环境,广泛应用于影视制作、视频编辑、在线平台及虚拟现实等领域。

海螺视频APP

海螺视频APP是一款基于AI技术的视频生成工具,支持文生视频和图生视频功能,提供丰富的镜头控制选项,让用户能像专业导演一样创作动态视频。该工具适用于多种场景,如社交媒体、广告营销、影视制作等,操作简便,适合各类用户使用。

YT Navigator

YT Navigator 是一款基于 AI 的 YouTube 内容检索工具,支持自然语言查询、语义搜索和视频内容交互。用户可快速定位视频片段并获取时间戳,提升信息获取效率。适用于研究、学习、创作和分析等场景,具备频道管理、安全会话等功能。采用向量嵌入与 BM25 算法结合的搜索机制,提高搜索准确率,项目已开源。

LipDub

LipDub是一款利用AI技术的多语言配音工具,可将视频实时翻译成27种语言,确保声音与口型同步。其核心功能包括实时录制与翻译、高质量翻译、多语言支持及便捷分享,适用于教育、商务、旅游及娱乐等多种场景,助力全球化的跨文化交流与内容传播。

LipRead Pro

LipRead Pro 是一款基于AI技术的视频唇读工具,可将视频中的唇部动作转换为文字,支持多语言和口音识别。其高精度算法确保了文字输出的准确性,适用于内容创作、无障碍辅助、安全监控、历史档案修复等多种场景。操作简便,处理高效,注重用户数据隐私保护,适合专业用户和普通用户使用。

Checksub

Checksub 是一个利用人工智能技术提供视频和音频本地化服务的平台,它通过 AI 驱动的字幕生成和配音功能,帮助用户将视频内容翻译成不同语言,从而扩大观众范围。

Motion Dreamer

Motion Dreamer是由香港科技大学(广州)研发的视频生成框架,采用两阶段架构生成物理合理的视频内容。通过引入“实例流”实现从稀疏到密集的运动控制,支持用户以少量提示生成时间连贯的视频。其随机掩码训练策略增强了模型的推理能力与泛化性能,已在多个数据集上验证其优越性。适用于视频创作、动画制作、VR/AR及自动驾驶等多个领域。

Wisecut

Wisecut 是一款利用人工智能技术的在线视频编辑工具,其核心功能包括 AI 高光检测、自动字幕生成与多语言翻译、基于语音的故事板编辑、智能背景音乐匹配以及静音段落自动移除等。它特别适合用于社交媒体内容创作、视频博客、在线教育、产品营销和企业培训等领域,帮助用户快速制作高质量的短视频或音频内容。

NutWorld

NutWorld是由新加坡国立大学、南洋理工大学与Skywork AI联合开发的视频处理框架,能够高效地将单目视频转换为动态3D高斯表示(Gaussian Splatting)。它基于时空对齐高斯(STAG)表示法,实现视频的时空连贯建模,支持高保真视频重建和多种下游任务,如新视图合成、视频编辑、帧插值和深度预测。该工具具备实时处理能力,适用于视频创作、AR/VR、自动驾驶等多个领域。

食用手册

这是由程序员@云游君开发的一个开源在线工具,能根据用户选择的食材和厨具,智能推荐可以制作的菜谱。