6月12日晚,人工智能初创公司Stability AI宣布正式开源其最新的文本到图像生成模型——Stable Diffusion 3 Medium(SD3 Medium)。该模型包含20亿个参数,是Stability AI迄今为止最复杂的文本到图像生成模型,代表了生成式AI发展的重要里程碑。SD3 Medium具有较小的VRAM占用,使其能够在消费级GPU和企业级GPU上高效运行。 Stable Diffusion 3 Medium的特点如下: - **先进性**:拥有20亿参数,是Stability AI迄今为止最为复杂的图像生成模型。 - **适用性**:尺寸适中,适合在消费级PC、笔记本电脑及企业级GPU上运行。 - **开放性**:SD3 Medium的权重已在非商业许可和低成本创作者许可下开放,鼓励专业艺术家、设计师、开发者和AI爱好者进行使用。 - **多平台支持**:支持API试用,可在Stability平台、Stable Assistant(免费三天试用)和通过Discord的Stable Artisan上尝试。 改进点包括: - **照片级真实感**:减少手部和面部的常见伪影,提供高质量图像。 - **提示遵循**:能够理解和生成复杂提示,如空间关系、构图元素、动作和风格。 - **排版能力**:借助Diffusion Transformer架构,在生成文本时实现无伪影和拼写错误。 - **资源效率**:设计考虑了资源效率,即使在标准消费级GPU上也能保持高性能。 - **微调能力**:能从小数据集中吸收细节,支持定制化。 合作伙伴方面,Stability AI与NVIDIA和AMD进行了合作,分别通过NVIDIA® RTX™ GPU和TensorRT™、AMD的最新APU、消费级GPU和MI-300X企业级GPU优化了SD3 Medium的性能。 Stability AI致力于开放的生成性AI,并推出了新的Creator License以支持商业用途。同时,公司采取了全面的安全措施,确保SD3 Medium的安全和负责任的使用。未来,Stability AI计划根据用户反馈持续改进SD3 Medium,提高其性能和功能。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部