图像 - 智狐AI导航

混元DiT

混元DiT（Hunyuan-DiT）是腾讯混元团队开源的高性能文本到图像的扩散Transformer模型，具备细粒度的中英文理解能力，能够生成多分辨率的高质量图像。该模型结合了双语CLIP和多语言T5编码器，通过精心设计的数据管道进行训练和优化。混元DiT的主要功能包括双语文本到图像生成、细粒度中文元素理解、长文本处理能力、多尺寸图像生成、多轮对话和上下文理解、高一致性和艺术性。此外，混元DiT在

AI项目与工具 2024年01月01日 64 点赞 0 评论 595 浏览

Picsman

Picsman是一款集成了多种AI图像处理功能的在线工具，支持一键抠图换背景、消除笔、批量编辑、AI背景生成及图片高清化等功能。其操作简单，适用于电商、社交媒体等多种场景，能显著提升图像质量与视觉表现力，同时提供丰富的设计资源辅助内容创作。

AI项目与工具 2025年06月11日 90 点赞 0 评论 595 浏览

TripoSG

TripoSG 是一种基于大规模修正流模型的高保真 3D 形状生成技术，能够从单张图像生成高质量的 3D 网格模型。其核心优势包括高分辨率重建、语义一致性、强泛化能力和稳健的性能。通过混合监督训练策略和高质量数据集，TripoSG 实现了更精准的几何表示与细节还原。该技术适用于工业设计、VR/AR、自动驾驶、教育及游戏开发等多个领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 595 浏览

RMBG

RMBG-2.0是一款基于先进AI技术的开源图像背景移除模型，通过深度学习和多模态数据处理实现了高达90.14%的准确率。该模型在高分辨率图像上经过大量训练，支持电子商务、广告、游戏开发等领域，具备高精度背景移除、多模态数据处理及云服务器无关架构等特点，为用户提供了高效、灵活的解决方案。

AI项目与工具 2025年06月12日 91 点赞 0 评论 595 浏览

ScribbleDiff

ScribbleDiff是一种创新的文本到图像生成技术，通过涂鸦分析和传播算法，将用户简单的涂鸦转换为高质量的图像。其核心技术包括矩对齐和涂鸦传播，确保生成图像的方向一致性与细节完整性。ScribbleDiff支持多种应用场景，如艺术创作、游戏开发、教育、广告设计和UI/UX设计，为用户提供直观、高效且无须额外训练的图像生成体验。

AI项目与工具 2025年06月12日 55 点赞 0 评论 594 浏览