扩散变换器

In

In-Context LoRA是一种基于扩散变换器（DiTs）的图像生成框架，通过微调少量数据实现多样化图像生成任务。它无需修改原始模型结构，减少了对大规模标注数据的依赖，同时保持了高质量的生成效果。该工具支持多任务图像生成、上下文学习能力、任务无关性以及条件图像生成等功能，适用于故事板生成、字体设计、家居装饰等多个领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 859 浏览

OmniSync

OmniSync是由中国人民大学、快手科技和清华大学联合开发的通用对口型框架，基于扩散变换器实现视频中人物口型与语音的精准同步。它采用无掩码训练范式，直接编辑视频帧，支持无限时长推理，保持自然面部动态和身份一致性。通过渐进噪声初始化和动态时空分类器自由引导（DS-CFG）机制，提升音频条件下的口型同步效果。OmniSync适用于影视配音、虚拟现实、AI内容生成等多个场景。

AI项目与工具 2025年06月11日 27 点赞 0 评论 867 浏览

UNO

UNO是字节跳动推出的AI图像生成框架，支持单主体和多主体图像生成，解决多主体一致性难题。采用扩散变换器和渐进式跨模态对齐技术，结合通用旋转位置嵌入（UnoPE），实现高一致性与可控性。适用于虚拟试穿、产品设计、创意设计等多个领域，具备强大泛化能力，已开源并提供完整技术文档。

AI项目与工具 2025年06月11日 23 点赞 0 评论 906 浏览

扩散变换器

首页

扩散变换器

列表

默认

浏览次数

发布日期

In

OmniSync

UNO

扩散变换器 首页 扩散变换器

列表 默认 浏览次数 发布日期

In

OmniSync

UNO

扩散变换器

首页

扩散变换器

列表

默认

浏览次数

发布日期