ChatDZQ爱晚亭 基于大语言模型开发,提供“智能+个性微调+向量训练”(即CVP)服务,集成AI聊天、AI创作、AI绘画、AI海报及各种AI工具。 AI服务商 2025年06月05日 10 点赞 0 评论 330 浏览
NVLM NVLM是NVIDIA研发的多模态大型语言模型,涵盖图像理解、语言理解、跨模态融合、图像描述生成、视觉推理及多模态翻译等功能。它具备多种架构(NVLM-D、NVLM-X、NVLM-H),并采用动态高分辨率输入、1-D平铺标签设计及多模态预训练与微调技术,广泛应用于图像描述、视觉问答、文档理解、多模态搜索及辅助驾驶等领域。 AI项目与工具 2025年06月12日 57 点赞 0 评论 330 浏览
moonshot moonshot-v1-vision-preview 是一款由月之暗面开发的多模态图像理解模型,具备精准的图像识别、OCR 文字识别和数据解析能力。支持 API 集成,适用于内容审核、文档处理、医学分析、智能交互等多个领域。模型可识别复杂图像细节、分析图表数据,并从美学角度进行图像评价,适合需要高效图像处理和智能交互的应用场景。 AI项目与工具 2025年06月12日 52 点赞 0 评论 329 浏览
Being Being-M0是由北京大学、中国人民大学等机构联合研发的首个大规模人形机器人通用动作生成模型。基于百万级动作数据集 MotionLib 和 MotionBook 编码技术,实现动作序列的高效表示与生成。该模型支持文本驱动动作生成、动作迁移及多模态数据处理,可应用于人形机器人控制、动画制作、VR/AR、人机交互及运动康复等多个领域,显著提升动作生成的多样性和语义对齐精度。 AI项目与工具 2025年06月11日 13 点赞 0 评论 328 浏览
MMRole MMRole是一个由中国人民大学高瓴人工智能学院研究团队开发的多模态角色扮演智能体(MRPA)框架。该框架通过整合图像和文本,使智能体能够以特定角色进行更为自然和沉浸式的对话。MMRole框架包括一个大规模、高质量的多模态数据集和一个全面的评估方法,用于开发和评估MRPAs的性能。该框架为创建能够理解和生成与图像相关对话内容的智能体提供了新的可能,并扩展了其在教育、娱乐、客户服务、社交模拟和内容创 AI项目与工具 2025年06月12日 28 点赞 0 评论 327 浏览
Ola Ola是一款由多机构联合开发的全模态语言模型,支持文本、图像、视频和音频等多种输入形式。通过渐进式模态对齐策略,逐步扩展模型的多模态理解能力,同时采用流式解码技术提升交互体验。其架构融合多种编码器与解码器,结合局部-全局注意力机制,实现高效多模态处理,在多项任务中表现优异。 AI项目与工具 2025年06月12日 98 点赞 0 评论 327 浏览
IMYAI智能助手 原名ILoveChatGPT,为用户提供丰富的AI服务,使用IMYAI,无需额外工具,即可让您畅享ChatGPT以及Midjourney等AI服务。 Ai平台模型 2025年06月05日 12 点赞 0 评论 327 浏览
TokenFD TokenFD是由上海交通大学与美团联合开发的细粒度图文对齐基础模型,专为文档理解任务设计。通过图像与语言Token的统一特征空间对齐,支持Token级图文交互,提升了多模态任务性能。其基于自研的TokenIT数据集进行训练,涵盖2000万张图像和18亿高质量Token-Mask对,覆盖多种文本图像类型。TokenFD可用于文档处理、图像审查、文字检索及大模型知识增强等多个领域,具有广泛的适用性和 AI项目与工具 2025年06月12日 90 点赞 0 评论 327 浏览
天工超级智能体 运用AI agent架构和深度研究技术,能一站式生成文档、PPT、表格、网页、播客和音视频等多种类型的内容,标志着“AI Office智能体”时代已经来临。 Ai办公效率 2025年06月05日 76 点赞 0 评论 327 浏览