R

ScreenAgent

一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。

八斗智能

八斗智能的语义理解模型是一个强大的工具,它通过大规模预训练和行业特定的迁移学习,能够提供高度准确的语义理解服务。

有道写作

结合有道词典APP,手写英文习作拍照上传,图片转文字,快速批改

Offer鸡

Offer鸡是一款面相广大年轻求职者的AI求职助手。

PhotoMaker

PhotoMaker,通过堆叠 ID 嵌入定制逼真的人体照片,可根据图片人物身份生成写真照

Luma AI Genie

Luma AI Genie是一款由Luma AI开发的文本生成3D内容工具。通过一句话就可以生成你想要的3D内容。Genie旨在为艺术家、设计师、开发者和教育工作者提供一个全新的创作平台,让他们能...

V

创新的自监督学习模型,它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容,还能在图像任务上表现出色,具有广泛的应用潜力。

DiT

创新的图像生成模型,它通过结合扩散模型和Transformer架构,实现了在图像生成任务中的高效和高质量输出。其可扩展性和条件生成能力使其在多个领域都有广泛的应用潜力。