视频

MM1.5

MM1.5是苹果公司研发的多模态大型语言模型,具备强大的文本与图像理解能力,包括视觉指代、定位及多图像推理功能。它通过数据驱动的训练方法,实现了从1B到30B参数规模的性能提升,并推出了视频和移动UI专用版本,为多模态AI技术发展提供重要参考。主要应用场景涵盖图像与视频理解、视觉搜索、辅助驾驶、智能助手及教育领域。

AI Transcribe

Transcribe 是一个基于 OpenAl 训练并开源的录音转文字工具,支持英语、中文等多种语言,最大的优点就是无需下载大型的模型文件。

Diffuse

Diffuse 是一款基于 AI 技术的视频编辑工具,支持用户通过自拍照生成个性化虚拟角色,并结合文本或图像生成高质量视频内容。其功能包括动作模仿、文本到视频生成、预剪辑选择及提示编辑,适用于社交媒体、广告、教育等多种场景。该工具专注于移动端使用,提升视频创作的便捷性与灵活性。

模力视频

一个AI驱动的在线视频编辑平台,它提供了智能剪辑、云剪辑服务和丰富的商用素材库。用户可以通过海量模板快速制作适应各种场景的视频内容,如电商、企业宣传、社交媒体运营等。

Vizard录屏

免费高清的在线电脑录屏、剪辑软件,无需下载安装软件。

BlurOn

BlurOn是一款使用NTT Data的AI技术的插件,用于视频编辑的AI自动马赛克软件,检测精度达99.7%,在电视节目和汽车行业等使用中,工作时间最多可减少90%。

SliceTube

一个YouTube视频下载器,提供了下载和剪辑任何格式视频的功能。

Sonic

Sonic是由腾讯与浙江大学联合开发的音频驱动肖像动画框架,基于音频信号生成逼真面部表情和动作。它通过上下文增强音频学习和运动解耦控制器,提升唇部同步精度与运动多样性。Sonic在长视频生成中表现出色,具备高稳定性与自然连贯性,支持用户自定义参数。适用于虚拟现实、影视制作、在线教育、游戏开发和社交媒体等多个领域。

BEN2

BEN2是一款由Prama LLC开发的深度学习图像和视频处理工具,专注于高效、精准的背景移除与前景分割。采用置信度引导抠图技术,可处理复杂细节,如头发和边缘,确保高精度分割。支持4K图像处理,具备GPU加速功能,适用于图像编辑、视频剪辑及批量处理等多种应用场景。

Wonder Dynamics

Wonder Dynamics的Wonder Studio是一个创新的AI工具,它通过自动化大部分VFX工作,极大地简化了视觉效果的创作过程。