BAGEL BAGEL是字节跳动开源的多模态基础模型,拥有140亿参数,采用混合变换器专家架构(MoT),通过两个独立编码器捕捉图像的像素级和语义级特征。它能够进行图像与文本融合理解、视频内容理解、文本到图像生成、图像编辑与修改、视频帧预测、三维场景理解与操作、世界导航以及跨模态检索等任务。BAGEL在多模态理解基准测试中表现优异,生成质量接近SD3,并适用于内容创作、三维场景生成、可视化学习和创意广告生成等 AI项目与工具 2025年06月11日 92 点赞 0 评论 429 浏览
Yodayo AI | 文本生成动漫图片 Yodayo是一个AI文本生成动漫图片工具,是一款先进的人工智能系统,它可以根据你输入的文字或图片,自动生成出免费、高质量的动漫风格的画面。 Ai绘画生成 2025年06月05日 94 点赞 0 评论 431 浏览
DCEdit DCEdit是一款基于双层控制机制的图像编辑工具,结合精确语义定位策略与视觉、文本自注意力优化,提升图像编辑的准确性和可控性。无需额外训练即可应用于现有扩散模型,支持复杂场景下的精细编辑任务,如对象替换、颜色调整等,适用于广告、影视、社交媒体等多个领域。 AI项目与工具 2025年06月12日 15 点赞 0 评论 434 浏览
DeepMesh DeepMesh是由清华大学和南洋理工大学研发的3D网格生成框架,结合强化学习与自回归变换器技术,实现高质量、高精度的3D模型生成。支持点云和图像条件输入,具备高效的预训练策略与人类偏好对齐机制,适用于虚拟环境、角色动画、医学模拟及工业设计等多个领域。 AI项目与工具 2025年06月12日 98 点赞 0 评论 436 浏览
EverArt EverArt是一款AI图像生成平台,支持用户通过上传图片训练自定义模型,生成风格一致的图像,适用于角色设计、艺术创作及多种应用场景。其功能包括多模型生成、姿势转换、魔法提示、图像放大和团队协作,提升创作效率与灵活性。 AI项目与工具 2025年06月12日 74 点赞 0 评论 438 浏览
DreamO DreamO是由字节跳动与北京大学联合开发的图像定制生成框架,基于扩散变换器(DiT)模型实现多条件图像生成。支持身份、风格、背景等条件的灵活集成,具备高质量生成、条件解耦和精准控制能力。适用于虚拟试穿、风格迁移、主体驱动生成等多种场景,具备广泛的适用性和技术先进性。 AI项目与工具 2025年06月11日 31 点赞 0 评论 439 浏览
生成时代 AIGC 多模态 API 平台,提供 AIGC 图像生成、图像编辑、视频生成、视频编辑、音频生成、训推一体等 API,免去 GPU 和模型维护成本,帮助开发者快速搭建 AIGC 应用。 Ai平台模型 2025年06月05日 88 点赞 0 评论 439 浏览