游戏

HeadGAP

HeadGAP是一款由字节跳动和上海科技大学联合研发的3D头像生成模型。该模型利用少量图片即可生成高度逼真的3D头像,具备高保真度、动画鲁棒性和多视图一致性等特点。HeadGAP通过先验学习、高斯Splatting网络、身份共享编码及部分动态建模等技术,实现了逼真的3D头像生成,并适用于虚拟社交、游戏开发、电影和动画制作等多种应用场景。

TrackGo

TrackGo是一种先进的AI视频生成技术,利用自由形状的遮罩和箭头提供精确的运动控制。其核心技术TrackAdapter无缝集成到预训练的视频生成模型中,通过调整时间自注意力层来激活与运动相关的区域。TrackGo在视频质量、图像质量和运动忠实度方面表现出色,适用于影视制作、动画制作、虚拟现实(VR)、增强现实(AR)和游戏开发等多个领域。

Omages

Omages是一个开源的3D模型生成项目,基于图像扩散技术将3D形状的几何和纹理信息编码到64×64像素的2D图像中。该工具不仅提高了3D对象生成的效率,还在低分辨率下保留丰富的细节。Omages支持3D对象生成、几何和纹理编码、多图谱表示以及自动材质生成等功能。它适用于3D打印与制造、虚拟现实、增强现实、游戏开发、电影和动画制作及室内设计等多种应用场景。

GameNGen

GameNGen是谷歌推出的一款AI游戏引擎,它能够以每秒20帧的速度实时生成高质量的DOOM游戏画面,使大多数玩家难以分辨真假。该工具无需编程,简化了开发流程,同时具备高逼真度和交互式体验,为游戏创作提供了新的可能性。除了游戏开发,它还能应用于虚拟现实、自动驾驶等多个领域,具有广泛的应用前景。

VFusion3D

VFusion3D 是一个由Meta和牛津大学研究团队共同开发的AI生成3D模型工具,可以从单张图片或文本描述生成高质量的3D对象。它通过微调预训练的视频AI模型生成合成的3D数据,解决了3D训练数据稀缺的问题。该工具具备快速生成3D模型、多视角渲染、高质量输出等功能,并广泛应用于虚拟现实、游戏开发、电影制作和3D打印等领域。

MUMU

MUMU是一种多模态图像生成模型,通过结合文本提示和参考图像来生成目标图像,提高生成的准确性和质量。该模型基于SDXL的预训练卷积UNet,并融合了视觉语言模型Idefics2的隐藏状态。MUMU能够在风格转换和角色一致性方面展现强大的泛化能力,同时在生成图像时能够很好地保留细节。主要功能包括多模态输入处理、风格转换、角色一致性、细节保留以及条件图像生成。

AI Song Generator

AI Song Generator是一款基于人工智能技术的在线工具,能够生成高质量且原创的歌曲。用户可通过简单的描述或自定义歌词、标题和风格来创作音乐。该工具支持多种语言,适用于视频背景音乐、广告歌曲、游戏配乐等多种场景。其主要功能包括一键生成歌曲、自定义模式、多风格支持、多语言歌词以及高品质输出。

My Drama

My Drama是一款创新的短剧应用,结合了AI聊天机器人技术,提供超过30部肥皂剧和短剧。用户不仅能观看这些剧集,还可以与剧中的AI角色进行互动对话,从而增强沉浸感。My Drama通过AI技术降低制作成本并提高内容生产效率,提供个性化的互动体验,并探索互动叙事的新领域。该应用可在Web、iOS和Android设备上使用,部分剧集免费,高级内容需付费解锁。

RegionDrag

RegionDrag是一种基于区域的图像编辑技术,由香港大学和牛津大学联合开发。该技术利用扩散模型,让用户通过定义手柄区域和目标区域来实现快速且精确的图像编辑。RegionDrag在单次迭代中完成编辑任务,显著减少编辑时间,同时采用注意力交换技术增强编辑的稳定性和自然性。主要应用领域包括数字艺术与设计、照片编辑、虚拟现实、游戏开发以及电影和视频制作等。

Vidu主体参照功能

Vidu的主体参照功能是一项由Vidu AI首次推出的参考一致性功能,旨在保持视频中单一主体(如真人、2D或3D角色)的一致性。该功能不仅支持对角色的面容、半身、全身特征进行精确控制,还涵盖多种角色类型和画风,包括写实风格和各种艺术风格。它能有效解决视频制作中的一致性问题,提升创作效率,并降低技术门槛,适用于艺术创作、商业广告、社交媒体内容、教育和培训、游戏开发以及电影和电视剧制作等多种应用场景。