LoRA

MooER

MooER是一款基于国产全功能GPU训练的开源音频理解大模型,由摩尔线程推出。它能够进行中文和英文的语音识别,并具备中译英的语音翻译能力。MooER在Covost2中译英测试集中取得25.2的BLEU分数,接近工业级标准。其主要功能包括语音识别、语音翻译、高效率训练以及开源模型。该模型采用深度学习架构和端到端训练模式,具有强大的多语言处理能力和广泛的适用性。

Artroom AI

一个允许用户在AI的帮助下创作艺术的平台。它使用一种称为**稳定扩散**的技术,可以从文本描述中生成逼真且多样化的图像.

Shakker

Shakker 是一款基于 AI 技术的图像生成与编辑平台,提供 Stable Diffusion 模型支持,具备图像局部修改、合成、背景去除、动作调整等功能。支持多种风格图像生成,包括动漫、肖像及表情包制作。适用于设计师、艺术家及游戏开发者,提供直观的操作界面,广泛应用于社交媒体营销、数字艺术创作及个性化礼物定制等领域。

TransPixar

TransPixar是由多所高校及研究机构联合开发的开源文本到视频生成工具,基于扩散变换器(DiT)架构,支持生成包含透明度信息的RGBA视频。该技术通过alpha通道生成、LoRA微调和注意力机制优化,实现高质量、多样化的视频内容生成。适用于影视特效、广告制作、教育演示及虚拟现实等多个领域,为视觉内容创作提供高效解决方案。

Filmfotos

Filmfotos是一款基于Flux架构的LoRA模型,专注于模拟和还原胶片质感。其低饱和度的日系胶片风格适用于多种场景,包括人物、风景、静物、食物和动物等,能够提升照片的艺术感和复古氛围。Filmfotos利用LoRA技术、深度学习和图像处理算法,实现高精度的图像生成,适用于摄影爱好者、专业人士及创意工作者。

FLORA AI

一款为创意专业人士打造的集成多模型、支持实时协作的 AI 画布工具。提供无限画布、多模型集成、节点式系统和实时协作等功能,快速生成创意草图、文案、图像。

ARTROOM

ARTROOM是一款集成了AI技术的图像生成与编辑平台,支持用户通过图层控制、Loras集成及ControlNets技术生成原创艺术作品或参考图片。平台具备丰富的功能,涵盖个性化定制、灵感获取等,并适用于个人艺术创作、企业营销、教育研究等多个领域,助力用户高效完成高质量视觉内容。

炉米Lumi

炉米Lumi是一款由字节跳动开发的AIGC图像创作平台,主要功能包括模型上传与展示、工作流搭建以及LoRA微调。它为AI爱好者、研究人员和开发者提供了一个协作环境,用于分享和优化AI模型。炉米Lumi支持多种应用场景,如科研、教育、艺术创作、商业应用开发等,具有开放性和高灵活性。 ---

EasyControl

EasyControl是基于扩散变换器(DiT)架构的高效控制框架,采用轻量级LoRA模块实现多条件控制,支持图像生成、风格转换、动画制作等任务。其具备位置感知训练范式和因果注意力机制,优化计算效率,提升生成质量与灵活性,适用于多种图像处理场景。

ComfyGen

ComfyGen是一款基于大型语言模型(LLM)的文本到图像生成系统,能够根据用户提供的文本提示自动生成高质量图像。它通过结合多种专业组件如微调基础模型、LoRAs、嵌入技术和超分辨率处理等构建复杂工作流,并采用两种基于LLM的方法优化图像生成质量,适用于艺术创作、游戏开发、广告设计、电影制作等多个领域。