开源项目

AnyText

一个创新的多语言视觉文本生成和编辑工具,利用先进的扩散模型技术,能够准确生成和编辑图像中的文本。它不仅支持多种语言和文本风格,还能在复杂的图像背景中保持文本的清晰度和...

ReplaceAnything

一个功能强大且用户友好的图像编辑工具,它通过AI技术实现了图像中物体的智能替换。无论是设计师、摄影师还是普通用户,都可以利用这个工具创造出独特的视觉效果,为创意工作带来...

MMMLU

重要的多语言、多任务语言理解数据集,它为研究人员和开发者提供了一个标准化的测试基准,用于评估和提升AI模型在不同语言和文化背景下的性能。

OLMo

一个开放的语言模型框架,它为研究人员和开发者提供了一套完整的工具和资源,以促进AI和语言模型的共同进步。

IP

一个强大的工具,它通过引入图像提示来增强文本到图像扩散模型的能力。它的设计轻量且高效,易于部署和使用,同时支持广泛的应用场景,包括图像生成、转换和修复。通过解耦的交叉...

Follow Your Pose

一个创新的文本到视频生成框架,它通过两阶段训练策略实现了高度的姿态控制和时间连贯性。该框架不仅能够根据文本描述生成视频,还能让用户通过姿态序列精确控制视频中角色的动作...

abab

一个强大的AI音乐生成工具,它通过先进的技术,使得音乐创作更加便捷和高效。无论是专业的音乐制作人还是业余爱好者,都能够利用这个模型来创作出高质量的音乐作品。

Draw an Audio

创新的视频生成音频系统,它通过先进的AI技术,能够自动分析视频内容并生成与之匹配的声音效果。

PhotoMaker V2

一个功能强大、操作简便的 AI 图像生成工具,它通过深度学习技术实现了快速、高质量的逼真人物图像生成。该工具不仅在技术上实现了突破,还在应用场景上展现了广泛的潜力,无论是...

UniEdit

UniEdit 是一个强大的视频编辑工具,它通过利用预训练的文本到视频生成器,在无需调优的情况下,提供了一种简单而有效的方法来编辑视频的运动和外观。