xGen xGen-MM是一款由Salesforce开发的开源多模态AI模型,具备处理文本和图像等数据类型的能力。该模型通过学习大量图像和文字信息,在视觉语言任务中表现出色,并通过开源模型、数据集和微调代码库促进模型性能的提升。xGen-MM具有多模态理解、大规模数据学习、高性能生成、开源可访问和微调能力等特点。其应用场景广泛,包括图像描述生成、视觉问答、文档理解、内容创作和信息检索等。 AI项目与工具 2025年06月12日 57 点赞 0 评论 155 浏览
文本到视频生成:CogVideoX (2024) 和 CogVideo (ICLR 2023) 文本到视频生成:CogVideoX (2024) 和 CogVideo (ICLR 2023) 视频生成 2025年06月26日 0 点赞 0 评论 16 浏览