FlagevalMM FlagEvalMM是一个由北京智源人工智能研究院开发的开源多模态模型评测框架,专注于评估处理文本、图像、视频等多模态任务的模型性能。它支持多种任务和指标,采用解耦评测与推理的设计,提供统一的评测流程,集成丰富模型库并兼容多种后端引擎。该工具适用于学术研究、工业应用、模型开发、教育领域及内容创作等多个场景。 AI项目与工具 2025年06月12日 89 点赞 0 评论 391 浏览
Speech Speech-02 是 MiniMax 推出的先进文本到语音模型,支持零样本语音克隆和高质量语音合成,具备多语言支持和情感控制功能。采用自回归 Transformer 和 Flow-VAE 架构提升语音自然度和相似度,适用于配音、有声读物、智能助手等多种场景。提供 HD 和 Turbo 两个版本,满足不同性能需求。 AI项目与工具 2025年06月11日 33 点赞 0 评论 391 浏览
Tennr Tennr是一款利用AI技术优化医疗文档处理的平台,核心为RaeLM™视觉语言模型,支持文档分类、信息提取、资格审核等功能,广泛应用于患者入院、转诊管理、保险索赔等场景,显著提高医疗服务效率并降低人力依赖。 AI项目与工具 2025年06月12日 93 点赞 0 评论 391 浏览
Insert Anything Insert Anything是由多所高校联合开发的图像插入框架,支持多种场景下的对象无缝融合,如艺术创作、虚拟试穿和影视特效等。基于大规模数据集训练,具备高分辨率输出与语义一致性保障。用户可通过掩码或文本指令实现精准控制,适用于创意设计与数字内容生成领域。 AI项目与工具 2025年06月11日 30 点赞 0 评论 391 浏览
xGen xGen-MM是一款由Salesforce开发的开源多模态AI模型,具备处理文本和图像等数据类型的能力。该模型通过学习大量图像和文字信息,在视觉语言任务中表现出色,并通过开源模型、数据集和微调代码库促进模型性能的提升。xGen-MM具有多模态理解、大规模数据学习、高性能生成、开源可访问和微调能力等特点。其应用场景广泛,包括图像描述生成、视觉问答、文档理解、内容创作和信息检索等。 AI项目与工具 2025年06月12日 57 点赞 0 评论 390 浏览
Holara AI 一款AI动漫画卡通图片生成工具,用户只需输入他们的偏好和提示,然后Holara AI就会生成符合给定条件的动漫图像。 Ai绘画生成 2025年06月05日 17 点赞 0 评论 390 浏览
长臂猿AIGC系统 长臂猿AIGC系统内置智能聊天对话机器人、AI绘图、AI模型训练、营销内容创作、企业虚拟AI员工等数十项AI功能,可以训练自己的AI机器人,不限制用户数量,支持源码私有化部署。 Ai开源项目 2025年06月05日 48 点赞 0 评论 390 浏览
Mistral AI Mistral AI 推出了 Mistral 7B,这是一种突破性的 7.3B 参数语言模型,它的功能超越了许多大型模型,提供了增强的推理、理解和概括,同时高效且具有成本效益。 Ai平台模型 2025年06月05日 96 点赞 0 评论 390 浏览
书生·筑梦2.0 它不仅提供了更大的创作灵活性,还通过高质量的视频输出满足了用户对画质和帧率的高需求。Vchitect 2.0及其配套的VEnhancer框架,为视频内容创作者提供了强大的工具,以创造更加生... Ai平台模型 1970年01月01日 0 点赞 0 评论 389 浏览
MagicArticulate MagicArticulate是由南洋理工大学与字节跳动Seed实验室联合开发的3D模型动画化工具,支持自动骨架生成、蒙皮权重预测及高质量动画输出。其基于自回归Transformer架构,结合Articulation-XL大规模数据集,实现对多样化3D模型的高效处理。适用于3D动画、游戏开发、VR/AR、工业设计等多个领域,显著提升动画制作效率与质量。 AI项目与工具 2025年06月12日 22 点赞 0 评论 389 浏览