风格迁移

DreamO

DreamO是由字节跳动与北京大学联合开发的图像定制生成框架,基于扩散变换器(DiT)模型实现多条件图像生成。支持身份、风格、背景等条件的灵活集成,具备高质量生成、条件解耦和精准控制能力。适用于虚拟试穿、风格迁移、主体驱动生成等多种场景,具备广泛的适用性和技术先进性。

mnml.ai

mnml.ai 是一款面向建筑师和室内设计师的 AI 渲染工具,支持将手绘或数字草图快速转换为高质量渲染图,涵盖多种风格和应用场景。其具备 AI 草图转图像、视频制作、渲染增强、风格迁移等功能,操作简便,适合各类用户使用。同时支持文本提示生成设计,提升工作效率与表现力。

ImageFusion AI

ImageFusion AI 是一款基于人工智能的在线图像合成工具,支持快速、高质量的图像融合与风格转换。用户可通过预设样式或自定义参考图创建独特视觉效果,适用于艺术创作、设计、营销等多个场景。操作简便,输出清晰,适合个人及专业用户使用。

Custom

Custom-SVG 是一种基于文本提示生成定制风格 SVG 图形的框架,结合前馈模型与扩散模型的优势,实现结构规整且风格统一的矢量图形生成。支持风格定制、语义对齐和高效生成,适用于图形设计、UI 设计、网页设计及教育等多个领域。其核心技术包括路径级表示的扩散模型训练和基于图像扩散先验的风格迁移。

OmniConsistency

OmniConsistency 是新加坡国立大学推出的图像风格迁移模型,旨在解决复杂场景下风格化图像的一致性问题。该模型采用两阶段训练策略,将风格学习与一致性学习解耦,并支持与任意风格的 LoRA 模块集成,实现高效且灵活的风格化效果。它在多种风格下保持图像的语义、结构和细节一致性,具备更高的灵活性和泛化能力,在实验中表现出与 GPT-4o 相当的性能。

Modify Video

Modify Video 是 Luma AI 推出的创新 AI 视频编辑工具,支持在保留视频原始动作和运镜的基础上,对环境、风格和单个元素进行自由修改。它具备动捕与操纵、风格迁移、高保真创意控制等功能,提供多种输出变体和预设模式,提升视频创作的灵活性和效率。适用于影视制作、广告创意、动画设计等领域。

ContentV

ContentV是字节跳动开源的80亿参数文生视频模型框架,通过替换Stable Diffusion 3.5 Large的2D-VAE为3D-VAE并引入3D位置编码,提升视频生成能力。采用多阶段训练策略和流匹配算法,实现高效训练。支持文本到视频生成、自定义视频参数、风格迁移与融合、视频续写与修改等功能,适用于视频内容创作、游戏开发、VR/AR和特效制作等场景。

嘎嘎降AI

指的是软件名 AIGCleaner,可以降低 AI 生成内容检测率和论文查重率。利用语义同位素、风格迁移的方法在文章中祛除 AI 特征,从而降低论文 AI 率。

寻光

寻光是阿里达摩院推出的一站式AI视频创作平台,寻光目标是让视频生成编辑过程像操作PPT一样简单。