生成

RealisHuman

RealisHuman 是一个用于优化生成图像中人体部位的后处理框架,采用两阶段方法提升手部和面部等部位的真实性。它通过参考原始图像生成逼真结构,并重新绘制周围区域实现无缝融合,支持多种图像风格,适用于游戏、影视、艺术等领域。

PhysGen3D

PhysGen3D 是一款能够将单张图像转换为交互式 3D 场景并生成物理真实视频的工具。它结合图像分析与物理模拟技术,支持精确控制物体属性、动态效果整合及高质量渲染。适用于影视、VR/AR、教育、游戏和广告等多个领域,提供高效且逼真的视觉内容生成能力。

酷音

酷音网是一个真人配音与AI配音、视频拍摄与制作、音乐作词与谱曲、视频策划与创意等领域的创作、交易、推广运营于一体的音视频交易服务平台,致力于打造专注音视频领域的商业生态圈。

Phidias

Phidias是一款基于检索增强生成(RAG)技术的3D内容生成模型,通过元控制网络、动态参考路由和自参考增强等技术,实现高质量的3D模型生成。它可以从文本、图像或现有模型生成新内容,具备交互式生成、高保真补全等功能,广泛应用于3D艺术、游戏开发、建筑设计等领域。

Haiper AI

一家专注于视觉内容创作的生成式AI解决方案的人工知智能公司, Haiper AI的使命就是开发将文本和图片转换为动态视频或3D的模型。

Logent AI

全球首个AI Agent Logo生成器。它根据用户输入的产品名称、功能或标语等信息,像专业设计师一样思考,自动生成设计思路并创建多样化、个性化的Logo。

DistriFusion

DistriFusion是一个专为加速高分辨率扩散模型在多GPU环境中生成图像的分布式并行推理框架。通过将图像分割成多个小块并分配至不同设备上进行独立处理,它能够在不增加额外训练负担的情况下,将推理速度提升高达六倍,同时保持图像质量。其技术原理包括Patch Parallelism(分片并行)、异步通信、位移补丁并行性等,适用于多种现有的扩散模型。应用场景包括AI艺术创作、游戏和电影制作、VR/A

MVPaint

MVPaint是一款基于同步多视角扩散技术的3D纹理生成框架,具备同步多视角生成、空间感知3D修补和UV细化三大核心功能。它能够生成高分辨率、无缝且多视图一致的纹理,广泛应用于游戏开发、动画制作、虚拟现实、增强现实及建筑可视化等领域。

TEXT2SQL.AI

TEXT2SQL.AI是一款基于AI技术的SQL查询生成工具,支持多种数据库语言,能够将自然语言转换为优化的SQL查询语句。它具备文本到SQL查询生成、多语言支持、数据库表集成及SQL错误修正等功能,广泛应用于学习教育、数据分析、数据科学和软件开发等领域,致力于提高工作效率并确保数据安全。

Speech

Speech-02 是 MiniMax 推出的先进文本到语音模型,支持零样本语音克隆和高质量语音合成,具备多语言支持和情感控制功能。采用自回归 Transformer 和 Flow-VAE 架构提升语音自然度和相似度,适用于配音、有声读物、智能助手等多种场景。提供 HD 和 Turbo 两个版本,满足不同性能需求。