游戏

GameGen

GameGen-O 是一款基于 Transformer 架构的AI工具,专注于开放世界游戏视频的生成。它具备角色生成、环境构建、动作模拟及交互式控制等功能,通过两阶段训练方法提升了生成质量和灵活性,可应用于游戏原型设计、场景生成及开发辅助等领域,有助于降低开发成本并提高创作效率。

海豚配音TTS Online

海豚配音TTS Online是一个多功能的在线TTS服务平台,它通过先进的语音合成技术,为用户提供了一种便捷的方式来生成高质量的语音内容。

Kafkai

Kafkai是一种机器学习算法,可...

Hallo2

Hallo2是一款由复旦大学、百度公司和南京大学合作开发的音频驱动视频生成模型。它能够将单张图片与音频结合,并通过文本提示调节表情,生成高分辨率4K视频。Hallo2采用了补丁下降、高斯噪声等数据增强技术,提升了视频的视觉一致性和时间连贯性,同时通过语义文本标签提高了生成内容的可控性与多样性。该模型适用于电影、游戏、虚拟助手等多个领域,展现出强大的内容生成能力。

Voxify

Voxify是一款利用AI技术将文本转化为自然语音的专业工具,具备超过450种声音选择,支持140多种语言和方言。用户可自定义音调、语速及情感表达,满足多样化的应用场景。此外,Voxify支持多格式输出并提供API接口,便于集成至其他系统中。

MagicArticulate

MagicArticulate是由南洋理工大学与字节跳动Seed实验室联合开发的3D模型动画化工具,支持自动骨架生成、蒙皮权重预测及高质量动画输出。其基于自回归Transformer架构,结合Articulation-XL大规模数据集,实现对多样化3D模型的高效处理。适用于3D动画、游戏开发、VR/AR、工业设计等多个领域,显著提升动画制作效率与质量。

Audio2Face

一款由AI驱动的应用程序,通过语音生成富有表现力的3D面部动画。

FLUX Tools

FLUX Tools是一套由黑森林实验室开发的增强型文本到图像模型工具,包含FLUX.1 Fill、FLUX.1 Depth、FLUX.1 Canny和FLUX.1 Redux四个模块,能够通过文本描述和掩码对图像进行精确编辑和扩展,支持图像修复、扩展、结构化引导、混合与再创作等功能。工具基于深度学习和神经网络技术,结合结构引导和文本到图像转换功能,适用于多种应用场景,包括数字艺术创作、游戏开发、