Stability AI开源Stable Diffusion 3 Medium文生图模型

简介：Stable Diffusion 3 Medium是一款由Stability AI开源的文本到图像生成模型，拥有20亿个参数，适用于消费级和企业级GPU。该模型具备照片级真实感、强大的提示理解和排版能力，以及高资源效率。此外，它还支持API试用，并得到了NVIDIA和AMD的支持，以优化其性能。Stability AI致力于开放和安全的AI应用，并计划持续改进SD3 Medium。

AI小编 525 阅读 0 评论 67 点赞

官网地址

6月12日晚，人工智能初创公司Stability AI宣布正式开源其最新的文本到图像生成模型——Stable Diffusion 3 Medium（SD3 Medium）。该模型包含20亿个参数，是Stability AI迄今为止最复杂的文本到图像生成模型，代表了生成式AI发展的重要里程碑。SD3 Medium具有较小的VRAM占用，使其能够在消费级GPU和企业级GPU上高效运行。 Stable Diffusion 3 Medium的特点如下： - **先进性**：拥有20亿参数，是Stability AI迄今为止最为复杂的图像生成模型。 - **适用性**：尺寸适中，适合在消费级PC、笔记本电脑及企业级GPU上运行。 - **开放性**：SD3 Medium的权重已在非商业许可和低成本创作者许可下开放，鼓励专业艺术家、设计师、开发者和AI爱好者进行使用。 - **多平台支持**：支持API试用，可在Stability平台、Stable Assistant（免费三天试用）和通过Discord的Stable Artisan上尝试。改进点包括： - **照片级真实感**：减少手部和面部的常见伪影，提供高质量图像。 - **提示遵循**：能够理解和生成复杂提示，如空间关系、构图元素、动作和风格。 - **排版能力**：借助Diffusion Transformer架构，在生成文本时实现无伪影和拼写错误。 - **资源效率**：设计考虑了资源效率，即使在标准消费级GPU上也能保持高性能。 - **微调能力**：能从小数据集中吸收细节，支持定制化。合作伙伴方面，Stability AI与NVIDIA和AMD进行了合作，分别通过NVIDIA® RTX™ GPU和TensorRT™、AMD的最新APU、消费级GPU和MI-300X企业级GPU优化了SD3 Medium的性能。 Stability AI致力于开放的生成性AI，并推出了新的Creator License以支持商业用途。同时，公司采取了全面的安全措施，确保SD3 Medium的安全和负责任的使用。未来，Stability AI计划根据用户反馈持续改进SD3 Medium，提高其性能和功能。

本文分类：AI项目与工具
本文标签：文本到图像生成模型 AI工具图像生成开源软件模型优化高性能计算 AI艺术提示理解消费级GPU
浏览次数：525 次浏览
发布日期：2024-01-01 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/11638.html

评论列表共有 0 条评论

暂无评论

Stability AI开源Stable Diffusion 3 Medium文生图模型

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复