VIMI大模型,由商汤科技推出,是全球首个可控人物视频生成的AI工具,基于商汤的日日新大模型技术,可通过动作视频、动画、声音、文字等多种驱动元素操控人物图片,生成的画面效果不会因时间推移而降低质量或失真,可生成与目标动作一致的人物视频。此外,VIMI在人物稳定性、视频生成时长方面也有显著突破,能够稳定生成分钟级的单镜头人物视频。
VIMI大模型不仅能实现精准的人物表情控制,还可以控制照片中人物上半身的自然肢体动作,并自动生成与人物相符的头发、服饰及背景变化,光影变化也合理生成,确保人物动作和视觉效果流畅自然,画面和谐唯美,是一款稳定的可控人物视频生成产品。
VIMI大模型功能特征:
可控人物:VIMI能够精确控制视频中人物的面部表情和肢体动作,生成与目标动作高度一致的视频内容。无论是微妙的面部表情变化,还是复杂的全身动作,VIMI都能够准确捕捉并再现。
多种控制方式:VIMI提供了多样化的控制输入方式,包括人物视频、动画参数、语音文字等,让用户可以通过不同输入方法驱动视频生成,创造更丰富和多样的视频内容。
分钟级单镜头:支持生成分钟级的单镜头人物视频。
合理的视频场景生成:VIMI不仅关注人物表现,还能生成合理的视频场景,包括人物的头发、服饰、背景等元素的补全,以及光影变化的支持。这使得VIMI生成的视频不仅人物表现自然,整个场景也和谐统一。
稳定生成长视频:VIMI能够生成长达一分钟的单镜头人物视频,且画面效果稳定,不随时间劣化或失真。这是一个显著的突破。
VIMI大模型应用场景:
VIMI主要面向C端用户,适用于聊天、唱歌、舞动等多种娱乐互动场景。
娱乐创作:满足广大用户的娱乐创作需求,如生成数字分身和写真视频以及各种趣味的人物表情包。
影视制作:为影视作品提供高质量的人物视频素材,减少制作成本和时间。
动画制作:支持动画创作者使用骨架生成动作,提高动画制作效率。
VIMI大模型在2024年世界人工智能大会(WAIC)上发布,并入选大会展览展示最高荣誉“镇馆之宝”。VIMI大模型能够生成长达1分钟以上的单镜头人物视频,且画面效果不会随时间降低品质或失真,还能根据人物动作调整环境场景,模拟镜头角度变化和头发抖动,提供逼真的视觉效果。
VIMI将完全向广大用户开放使用。用户只需上传不同角度的高清人物照片,即可自动生成数字分身和不同风格的写真短片。针对喜爱自拍的用户,VIMI支援聊天、唱歌、舞动等多种娱乐互动场景。
发表评论 取消回复