创意

UNO

UNO是字节跳动推出的AI图像生成框架,支持单主体和多主体图像生成,解决多主体一致性难题。采用扩散变换器和渐进式跨模态对齐技术,结合通用旋转位置嵌入(UnoPE),实现高一致性与可控性。适用于虚拟试穿、产品设计、创意设计等多个领域,具备强大泛化能力,已开源并提供完整技术文档。

响指HaiSnap

HaiSnap是一款零代码AI应用开发平台,支持可视化操作和多模型调用,涵盖文本生成、图像识别等功能。用户可快速搭建并部署应用至云端,同时享受任务管理、小工具和小游戏等辅助功能,适用于教育、企业及个人场景,提升开发效率与用户体验。

Hailuo AI

Hailuo AI 是一款基于AI技术的视频生成工具,支持将文本和图片转化为动态视频内容。提供多种艺术风格与场景选择,最新模型可让2D插画动起来,适用于创意设计、影视制作等领域,帮助用户高效实现视觉创意,提升创作效率。

WaveSpeedAI

WaveSpeedAI 是一款集图像与视频生成于一体的 AI 平台,提供多个高性能模型,支持高质量图像生成、个性化风格定制及视频内容创作。平台具备超快速生成能力,适用于创意设计、广告制作和视频内容生产等领域,提供易用接口和企业级部署选项。

BlenderMCP

BlenderMCP 是一款将 Blender 与 Claude AI 集成的工具,通过 socket 服务器实现双向通信,支持 3D 对象操作、材质控制、场景信息获取及 Python 代码执行。用户可通过自然语言指令高效完成建模任务,提升创作效率。工具由插件和服务器组成,采用 JSON 协议进行数据交互,适用于快速建模、场景优化及教育辅助等场景。

iFable

iFable 是一个基于AI技术的互动角色扮演游戏平台,允许用户通过简单输入生成沉浸式故事体验。玩家可参与动态叙事,影响剧情发展,并与AI角色建立情感连接。平台支持多种故事类型,具备个性化定制功能,并鼓励用户分享创作成果。适用于娱乐、社交、创作及情感陪伴等多种场景。

万相首尾帧模型

万相首尾帧模型(Wan2.1-FLF2V-14B)是一款开源视频生成工具,基于DiT架构和交叉注意力机制,可根据用户提供的首帧和尾帧图像生成高质量、流畅的过渡视频。支持多种风格和特效,适用于创意视频制作、影视特效、广告营销等多个场景。模型具备细节复刻、动作自然、指令控制等功能,且提供GitHub和HuggingFace开源资源供用户使用。

Image to Music

Image to Music 是一款基于AI的图像转音乐工具,通过分析图像的颜色、形状和纹理等元素,生成多种风格的音乐。用户可直接上传图片并选择模型,快速获得钢琴、吉他、管弦乐等音乐作品。无需注册,无使用限制,适用于音乐创作、广告营销、教育及个性化礼物制作等多种场景,为艺术创作提供新思路。

AvatarFX

AvatarFX是由Character.AI开发的AI视频生成工具,通过上传图片和选择语音,可生成角色说话、唱歌和表达情感的动态视频。支持多角色、多轮对话及长视频生成,具备高时间一致性。采用扩散模型与音频条件化技术,确保动作与语音同步。适用于互动故事、虚拟直播、娱乐表演及教育内容创作,提供高效、高质量的视频生成体验。

Flex.2

Flex.2-preview是Ostris开发的开源文本到图像生成模型,具备80亿参数规模。支持长文本输入、图像修复和多模态控制输入,适用于创意设计、图像修复和内容生成等多种场景。模型基于扩散框架,采用多通道输入处理和高效推理算法,可通过ComfyUI或Diffusers库集成使用,适合实验性开发和个性化定制。