开源项目 - 智狐AI导航

一个创新的多语言视觉文本生成和编辑工具，利用先进的扩散模型技术，能够准确生成和编辑图像中的文本。它不仅支持多种语言和文本风格，还能在复杂的图像背景中保持文本的清晰度和...

Ai平台模型 1970年01月01日 0 点赞 0 评论 273 浏览

是一个多模态视频数据集，它为AI模型提供了丰富的上下文信息，使其能够更深入地理解视频内容。这个数据集在视频内容分析、情绪分析、故事叙述理解、媒体编辑和多模态学习等领域具...

Ai平台模型 1970年01月01日 0 点赞 0 评论 274 浏览

创新的语音翻译大模型，它通过端到端的设计和深度学习技术，实现了高质量的实时语音翻译。无论是在国际会议、教育培训、旅游导航还是客户服务和医疗咨询等场景中，Gummy都能提供高...

Ai平台模型 1970年01月01日 0 点赞 0 评论 279 浏览

无论是在线使用还是本地部署，它都为用户提供了灵活、高效的代码生成解决方案。此外，通过提供编辑功能和代码导出，它满足了用户对代码调整和个性化的需求。

Ai平台模型 1970年01月01日 0 点赞 0 评论 279 浏览

一个功能强大、操作简便的 AI 图像生成工具，它通过深度学习技术实现了快速、高质量的逼真人物图像生成。该工具不仅在技术上实现了突破，还在应用场景上展现了广泛的潜力，无论是...

Ai平台模型 1970年01月01日 0 点赞 0 评论 279 浏览

创新的OCR模型，它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景，GOT-OCR 2.0都能提供强大的支持。

Ai平台模型 1970年01月01日 0 点赞 0 评论 282 浏览

一个开源的集成开发环境（IDE），专注于利用人工智能技术快速生成React和Tailwind CSS的UI组件。

Ai平台模型 1970年01月01日 0 点赞 0 评论 282 浏览

UniEdit 是一个强大的视频编辑工具，它通过利用预训练的文本到视频生成器，在无需调优的情况下，提供了一种简单而有效的方法来编辑视频的运动和外观。

Ai平台模型 1970年01月01日 0 点赞 0 评论 285 浏览

一个先进的计算机控制智能体，它通过观察屏幕截图和执行鼠标键盘动作来完成复杂的任务。它利用VLM和强化学习环境，可以在真实计算机屏幕上执行多步骤任务。

Ai平台模型 1970年01月01日 0 点赞 0 评论 287 浏览

强大的单目深度估计工具，它通过利用大规模未标注数据和先进的数据增强技术，实现了在多种复杂环境下的准确深度预测。其多任务学习和语义辅助功能使其在多个领域都有广泛的应用潜力。

Ai平台模型 1970年01月01日 0 点赞 0 评论 289 浏览

开源项目

首页

开源项目