生成 - 智狐AI导航

DoraCycle

DoraCycle是由新加坡国立大学Show Lab开发的一种多模态生成模型，通过文本与图像间的双向循环一致性学习，实现跨模态信息转换与对齐。其核心优势在于无需大量标注数据即可完成领域适应，支持风格化设计、虚拟角色生成等多样化任务。模型采用自监督学习和梯度裁剪等技术提升训练稳定性，适用于广告、教育等多个应用场景。

AI项目与工具 2025年06月12日 19 点赞 0 评论 510 浏览

Animate

Animate-X 是一个基于 Latent Diffusion Model 的通用动画框架，可将静态图像转化为高质量的动态视频，特别适合拟人化角色动画的生成。它通过引入隐式和显式姿势指示器，增强了对运动模式的捕捉能力，并支持多种角色类型，无需严格对齐。该工具在游戏开发、影视制作、虚拟现实及社交媒体内容创作等方面具有广泛应用价值。 ---

AI项目与工具 2025年06月12日 27 点赞 0 评论 510 浏览

Vidgo AI

一个多合一AI图像、音乐和视频生成器，能将文字、图片等素材变成图像、音乐和视频等多媒体内容。提供AI 图像生成、视频生成和编辑三大核心功能。

Ai绘画生成 2025年06月05日 78 点赞 0 评论 510 浏览

novelcrafter

Novelcrafter是一款面向小说作者的AI辅助写作工具，集成了角色设定、情节规划、灵感捕捉等功能，同时支持AI交互式对话与大纲细化，助力从创意萌芽到最终成稿的全流程。具备高度灵活性和隐私保障，适合各类写作需求。

AI项目与工具 2025年06月12日 60 点赞 0 评论 509 浏览

美间AI创意PPT

一款可以一键生成高质量PPT的AI设计平台，通过简单的操作，一键就可以生成各种类型的PPT，同时提供美化PPT，文档生成PPT、链接生成PPT等功能。

PPT资源 2025年06月05日 18 点赞 0 评论 509 浏览

ACE

ACE是一款基于扩散Transformer架构的多模态图像生成与编辑工具，通过长上下文条件单元（LCU）和统一条件格式实现自然语言指令的理解与执行。它支持图像生成、编辑、多轮交互等多种任务，适用于艺术创作、媒体制作、广告设计、教育培训等多个领域，提供高效且灵活的视觉内容解决方案。

AI项目与工具 2025年06月12日 74 点赞 0 评论 509 浏览

Video

Video-LLaVA2是一款由北京大学ChatLaw课题组开发的开源多模态智能理解系统。该系统通过时空卷积（STC）连接器和音频分支，显著提升了视频和音频的理解能力。其主要功能包括视频理解、音频理解、多模态交互、视频问答和视频字幕生成。时空建模和双分支框架是其核心技术原理。Video-LLaVA2广泛应用于视频内容分析、视频字幕生成、视频问答系统、视频搜索和检索、视频监控分析及自动驾驶等领域。

AI项目与工具 2025年06月12日 50 点赞 0 评论 509 浏览