文本到图像

SANA 1.5

SANA 1.5是由英伟达联合多所高校研发的高效线性扩散变换器，专用于文本到图像生成任务。其核心优势包括高效的训练扩展、模型深度剪枝、推理时扩展等技术，能够在不同计算预算下灵活调整模型性能。支持多语言输入，并具备开源特性，适用于创意设计、影视制作、教育等多个领域。实验表明，其生成质量接近行业领先水平，同时显著降低计算成本。

AI项目与工具 2025年06月12日 56 点赞 0 评论 571 浏览

VITRON

VITRON是一款由多家顶尖机构联合研发的像素级视觉大型语言模型，具备强大的图像与视频处理能力，涵盖理解、生成、分割及编辑等功能。它融合了编码器-LLM-解码器架构、视觉-语言编码和视觉专家系统，支持多种视觉任务，广泛应用于图像编辑、视频创作、教育辅助、电商营销和新闻报道等领域。

AI项目与工具 2025年06月12日 53 点赞 0 评论 572 浏览

Stability AI

Stability AI提供了一套完整的生成式AI模型，覆盖图像、视频和音频等多个领域，旨在推动AI技术的普及和应用。

Ai视频生成 1970年01月01日 0 点赞 0 评论 585 浏览

SDXL

SDXL-Lightning是一种基于扩散模型的文本到图像生成技术，由字节跳动的研究团队开发。该模型通过结合渐进式和对抗式蒸馏方法，能够在一至少数步骤内快速生成1024像素分辨率的高质量图像。该模型提供开源模型和权重，支持与现有的LoRA模块和控制插件兼容，可以轻松集成到现有的图片生成系统中。核心技术包括扩散模型、渐进式蒸馏、对抗式蒸馏和鉴别器设计，以确保生成图像的质量和多样性。

AI项目与工具 2024年01月01日 91 点赞 0 评论 588 浏览

SnapGen

SnapGen是一款由Snap Inc、香港科技大学和墨尔本大学联合开发的文本到图像扩散模型，专为移动设备设计，支持在1.4秒内生成1024×1024像素的高分辨率图像。它通过优化网络架构、跨架构知识蒸馏和对抗性训练等技术，在保持小模型规模的同时，提供了高质量的图像生成能力，适用于社交媒体、移动应用、教育、新闻等多个领域。

AI项目与工具 2025年06月12日 75 点赞 0 评论 593 浏览

ScribbleDiff

ScribbleDiff是一种创新的文本到图像生成技术，通过涂鸦分析和传播算法，将用户简单的涂鸦转换为高质量的图像。其核心技术包括矩对齐和涂鸦传播，确保生成图像的方向一致性与细节完整性。ScribbleDiff支持多种应用场景，如艺术创作、游戏开发、教育、广告设计和UI/UX设计，为用户提供直观、高效且无须额外训练的图像生成体验。

AI项目与工具 2025年06月12日 55 点赞 0 评论 594 浏览

混元DiT（Hunyuan-DiT）是腾讯混元团队开源的高性能文本到图像的扩散Transformer模型，具备细粒度的中英文理解能力，能够生成多分辨率的高质量图像。该模型结合了双语CLIP和多语言T5编码器，通过精心设计的数据管道进行训练和优化。混元DiT的主要功能包括双语文本到图像生成、细粒度中文元素理解、长文本处理能力、多尺寸图像生成、多轮对话和上下文理解、高一致性和艺术性。此外，混元DiT在

AI项目与工具 2024年01月01日 64 点赞 0 评论 595 浏览

EyeDiff

EyeDiff是一款基于扩散模型的文本到图像生成工具，专为多模态眼科图像生成设计。通过自然语言提示，EyeDiff能够捕捉常见及罕见眼病的关键特征，显著提升诊断准确性。该工具采用CLIP文本编码器与交叉注意力机制，结合潜在扩散模型（LDM），生成高质量、与文本高度一致的图像，适用于数据增强、疾病筛查、数据共享及医学教育等场景。

AI项目与工具 2025年06月12日 89 点赞 0 评论 600 浏览

VEED AI官网

VEED AI游戏生成器是一个多功能的AI工具，它通过文本到图像的转换技术，帮助游戏开发者快速获取游戏设计和营销的视觉素材。

Ai语音工具 1970年01月01日 0 点赞 0 评论 607 浏览

AI Anime Generator

AI Anime Generator 是一款基于人工智能技术的在线工具，能够根据用户提供的文本描述或上传的照片生成具有动漫风格的图像。该工具支持文本到动漫生成、照片到动漫转换、多种动漫风格选择、实时生成和视频转换等功能，适用于角色设计、虚拟主播形象设计、动漫艺术教育、社交媒体内容制作及粉丝艺术创作等场景。

AI项目与工具 2025年06月12日 37 点赞 0 评论 613 浏览

文本到图像

首页

文本到图像

列表

默认

浏览次数

发布日期