R

V

创新的自监督学习模型,它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容,还能在图像任务上表现出色,具有广泛的应用潜力。

PhotoMaker

PhotoMaker,通过堆叠 ID 嵌入定制逼真的人体照片,可根据图片人物身份生成写真照

Luma AI Genie

Luma AI Genie是一款由Luma AI开发的文本生成3D内容工具。通过一句话就可以生成你想要的3D内容。Genie旨在为艺术家、设计师、开发者和教育工作者提供一个全新的创作平台,让他们能...

八斗智能

八斗智能的语义理解模型是一个强大的工具,它通过大规模预训练和行业特定的迁移学习,能够提供高度准确的语义理解服务。

有道写作

结合有道词典APP,手写英文习作拍照上传,图片转文字,快速批改

Offer鸡

Offer鸡是一款面相广大年轻求职者的AI求职助手。

ScreenAgent

一个先进的计算机控制智能体,它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境,可以在真实计算机屏幕上执行多步骤任务。

GOT

创新的OCR模型,它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景,GOT-OCR 2.0都能提供强大的支持。