工具

FUZZ

由Riffusion推出的一款基于扩散模型(Diffusion Model)的全新音乐生成模型,该工具能够通过“想象”生成音频的声谱图(Spectrogram),然后将其转换为音频。

TripoSR

TripoSR是一款由Stability AI与VAST联合开发的开源3D生成模型,能够在不到0.5秒内从单张2D图像生成高质量的3D模型。基于Transformer架构和大型重建模型(LRM)设计,采用先进的图像编码、三平面NeRF表示及优化训练策略,支持无GPU设备运行。适用于游戏开发、影视制作、建筑设计、产品设计等多个领域,具有高效、高精度和广泛适用性的特点。

WeShop商拍

WeShop是国内首款AI商拍工具,专注于电商产品图片的智能生成。它旨在帮助品牌商家解决商品图拍摄成本高、模特贵等痛点,同时提供高效且成本效益高的解决方案。

Playground v3

Playground v3是一款基于大型语言模型(LLM)的文本到图像生成工具,具备240亿参数量的潜扩散架构(LDM),能够精准理解和生成复杂的图像内容,支持RGB颜色控制和多语言文本生成。其核心功能包括文本到图像生成、图形设计、RGB颜色控制和多语言支持,广泛应用于设计、内容创作、游戏开发、广告等多个领域。

SignLLM

SignLLM是一款支持多语言手语生成的AI模型,能将文本转换为自然流畅的手语视频,覆盖包括ASL、GSL、LSA、KSL在内的八种手语。其核心技术包括离散化与层次化表示、自监督学习、符号-文本对齐等。该工具可用于教育、医疗、法律、媒体等多个场景,提升听障人群的沟通便利性与信息获取能力。

LLM2LLM

LLM2LLM是一种基于教师-学生架构的迭代数据增强方法,通过生成针对性的合成数据提升语言模型在低数据量场景下的性能。该技术通过识别并强化模型预测错误的数据点,实现精准优化,同时控制数据质量和规模。适用于医学、法律、教育等数据稀缺领域,具有良好的可扩展性和实用性。

HumanRig

HumanRig是由阿里巴巴团队研发的3D人形角色自动绑定系统,提供大规模高质量数据集和先进算法,支持从粗到细的骨架估计与蒙皮优化。其核心组件包括先验引导骨架估计器(PGSE)和网格-骨架互注意网络(MSMAN),适用于游戏开发、影视制作、VR/AR及数字人应用,有效提升3D角色动画制作效率和质量。

Pablo

Pablo是一款AI驱动的网页设计工具,支持用户通过上传Logo快速生成品牌化网站,并提供无代码编辑功能。它能够自动匹配配色方案,支持在线定制与发布,同时具备图片制作能力,可生成符合社交媒体规范的图像内容。适用于品牌建设、个人展示及小型企业网站搭建等多种场景。

Midjourney提示词(咒语)生成器

Midjourney提示词(咒语)是一个免费在线生成器,可以快速生成midjourney关键词、咒语的实用工具平台,内置2000+宝典,实时翻译,利用Midjo