生成

SnapGen

SnapGen是一款由Snap Inc、香港科技大学和墨尔本大学联合开发的文本到图像扩散模型,专为移动设备设计,支持在1.4秒内生成1024×1024像素的高分辨率图像。它通过优化网络架构、跨架构知识蒸馏和对抗性训练等技术,在保持小模型规模的同时,提供了高质量的图像生成能力,适用于社交媒体、移动应用、教育、新闻等多个领域。

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足

ProfilePicture.AI

Postcraft的免费PFP Maker是一个在线工具,允许用户为他们的社交媒体账户创建自定义头像。它允许用户上传照片,然后该工具将自动删除背景,并生成数百张独特的头像照片。

G3D.AI {Jedi}

G3D.AI 是一家开发用于游戏创作的人工智能 (AI) 工具的公司。它旨在通过使用自然语言提示,使游戏创作者能够在很短的时间内构建出精美、新颖的游戏。

Amodal3R

Amodal3R 是一种基于条件的 3D 生成模型,能够从部分遮挡的 2D 图像中重建完整的 3D 模型。通过引入掩码加权多头交叉注意力机制和遮挡感知注意力层,提升了遮挡场景下的重建精度。该模型仅使用合成数据训练,却能在真实场景中表现出色,具有较强的泛化能力。广泛应用于 AR/VR、机器人视觉、自动驾驶及 3D 资产创建等领域。

Svg.la

Svg.la 是一款基于人工智能的 SVG 文件生成与转换工具,支持文本转 SVG 和图像转 SVG 功能。用户可以输入文本提示或上传图像,生成高质量、可缩放的矢量图形,广泛应用于品牌设计、图标制作、艺术作品转换及网页和移动应用开发等领域,满足多语言需求。

WonderPlay

WonderPlay 是斯坦福大学与犹他大学联合开发的新型框架,能够从单张图片和用户定义的动作生成动态3D场景。它结合物理模拟与视频生成技术,支持多种物理材质和动作类型,实现逼真的动态效果。用户可通过简单操作与场景互动,生成丰富的物理响应。该工具具备交互式查看器,适用于AR/VR、影视特效、教育、游戏开发等多个领域。

Aiease AI

成都亿乐科技开发的 ,一款基于AI的免费在线照片编辑工具。它不需要用户掌握专业设计技能,只需简单操作,就能实现多种实用的图片处理效果,适合个人日常修图和商业场景使用。

SeaArt.Ai

一款高效且用户友好的AI绘图工具,即使没有专业技能,您也可以立即成为艺术家。