DiT 创新的图像生成模型,它通过结合扩散模型和Transformer架构,实现了在图像生成任务中的高效和高质量输出。其可扩展性和条件生成能力使其在多个领域都有广泛的应用潜力。 Ai平台模型 1970年01月01日 0 点赞 0 评论 30 浏览
GOT 创新的OCR模型,它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景,GOT-OCR 2.0都能提供强大的支持。 Ai平台模型 1970年01月01日 0 点赞 0 评论 30 浏览
IP 一个强大的工具,它通过引入图像提示来增强文本到图像扩散模型的能力。它的设计轻量且高效,易于部署和使用,同时支持广泛的应用场景,包括图像生成、转换和修复。通过解耦的交叉... Ai平台模型 1970年01月01日 0 点赞 0 评论 30 浏览
I2VGen 一个强大的图像到视频的生成模型,它通过创新的方法解决了AI视频合成过程中的语义准确性、清晰度和时空连续性的挑战。用户可以轻松地将静态图像转换为高质量的动态视频,生成的视... Ai平台模型 1970年01月01日 0 点赞 0 评论 30 浏览
书生·物华2.0(3DTopia 2.0) 采用创新的原语(primitive-based)三维表示方法PrimX,能够高效编码和生成具有物理基础渲染(PBR)特性的高质量三维资产。 Ai平台模型 1970年01月01日 0 点赞 0 评论 30 浏览
V 创新的自监督学习模型,它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容,还能在图像任务上表现出色,具有广泛的应用潜力。 Ai平台模型 1970年01月01日 0 点赞 0 评论 31 浏览
MMMLU 重要的多语言、多任务语言理解数据集,它为研究人员和开发者提供了一个标准化的测试基准,用于评估和提升AI模型在不同语言和文化背景下的性能。 Ai平台模型 1970年01月01日 0 点赞 0 评论 31 浏览