视频

CloneAI

一款AI驱动的视频转换应用程序,可以将两张不同时空中拍摄的照片丝滑地拥抱在一起的视频,也可可以通过上传一段视频,将视频中的人物换成一个现实生活中不存在的人物,同时保证动作的完美同步。

Faceplay秀脸

FacePlay是一款基于AI技术的多功能应用程序,提供视频换脸、照片动画、AI滤镜、写真生成、对口型模拟及证件照制作等功能。凭借其丰富的模板库和直观的操作界面,用户可以高效生成高质量的内容,适用于社交媒体创作、娱乐、个性化尝试及艺术设计等多个领域。

声咖

只需导入文本或上传已录制的音频,选择音色,即可生成高品质的小说配音音频内容。

光映AI视频创作平台

一款 AI驱动的视频创作平台,可快速将文字、图片等内容转化为 TikTok、Instagram 、YouTube 视频与虚拟形象视频,无需视频编辑技能。

Perfectly AI

Pictory 是一个网站,可帮助您根据文本创建视频。您可以使用它来制作引人入胜的故事、演示文稿或广告。

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型,通过“扩展-压缩”策略优化处理高分辨率图像和长视频,兼具效率与准确性。它在图像和视频基准测试中表现优异,支持时间定位、机器人导航和医疗成像等应用场景,并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

MM1.5

MM1.5是苹果公司研发的多模态大型语言模型,具备强大的文本与图像理解能力,包括视觉指代、定位及多图像推理功能。它通过数据驱动的训练方法,实现了从1B到30B参数规模的性能提升,并推出了视频和移动UI专用版本,为多模态AI技术发展提供重要参考。主要应用场景涵盖图像与视频理解、视觉搜索、辅助驾驶、智能助手及教育领域。

clone

Clone-Voice是一款基于深度学习的声音克隆工具,支持16种语言的文本转语音及声音风格转换,具有友好的操作界面和较低的硬件要求。它被广泛应用于视频制作、语言学习、有声出版物创作、广告宣传及游戏开发等领域,为用户提供多样化的个性化声音解决方案。

淘宝星辰

淘宝星辰是阿里妈妈推出的电商视频生成大模型,支持图片或文本指令生成高质量视频。具备智能商品展示、多语种语义理解、物理动作逻辑遵循及元素稳定性保障等功能,适用于商品主图、卖点展示、种草内容及虚拟试穿等场景,有效提升商品吸引力和转化效率。

MoviiGen 1.1

MoviiGen 1.1是由ZulutionAI推出的专注于生成电影级画质视频的AI模型,基于Wan2.1微调而成。它在氛围营造、镜头运动和物体细节保留方面表现优异,支持720P和1080P分辨率,适用于高保真场景和专业电影应用。模型具备提示扩展功能,可优化生成效果,并采用序列并行与环形注意力等技术提升性能。其应用场景包括电影制作、广告、游戏开发、VR/AR及教育等领域。