多模态

首页

多模态

列表

默认

浏览次数

发布日期

SpatialLM

SpatialLM

SpatialLM 是一款由群核科技推出的开源空间理解多模态模型，能通过分析普通手机拍摄的视频生成详细的 3D 场景布局，涵盖房间结构、家具摆放等信息。它结合大语言模型与点云重建技术，实现空间认知与语义标注，并支持低成本数据采集。该模型适用于具身智能训练、AR/VR、建筑设计等多个领域，具备物理规则嵌入和结构化场景生成能力。

AI项目与工具 2025年06月12日 82 点赞 0 评论 394 浏览

自由画布

自由画布

百度文库和百度网盘联合推出的一款产品，自由画布打通了公域与个人授权的私域内容，支持对多格式、全模态文件的混合理解、生成、创作，并实现了一键分享和存储。

Ai绘画生成 2025年06月05日 56 点赞 0 评论 393 浏览

智谱API

智谱API

新用户免费领1亿tokens，基于领先的千亿级多语言、多模态预训练模型，打造高效率、通用化的“模型即服务”AI开发新范式。

创作工具 1970年01月01日 0 点赞 0 评论 387 浏览

BuboGPT

BuboGPT

BuboGPT是一个创新的大型多模态语言模型，它通过结合视觉、音频和文本输入，提供了一种全新的交互体验。

Ai平台模型 1970年01月01日 0 点赞 0 评论 385 浏览

有言

是一个一站式AIGC视频创作平台，它提供了一个无需拍摄、剪辑和后期处理的解决方案，能够一键生成3D视频。

Ai视频生成 2025年06月05日 58 点赞 0 评论 385 浏览

华之科

华之科

基于openAi的大模型应用，提供支持多轮对话，内容创作、图片制作、音乐制作、图片文档表格等文件的内容解析的相关功能。

创作工具 1970年01月01日 0 点赞 0 评论 380 浏览

腾讯设计开放平台 – Top.AI

腾讯设计开放平台 – Top.AI

AIGC学习、创作、分享的平台,旨在引进更多的创意之源,分享更前沿的创意内容。

Ai绘画生成 1970年01月01日 0 点赞 0 评论 373 浏览

怪兽交互全息舱

怪兽交互全息舱

智能聊天机器人，智能屏交互数字人系统，实时交互数字人系统。

创作工具 1970年01月01日 0 点赞 0 评论 359 浏览

ChatMusician

ChatMusician

通过结合先进的大型语言模型和音乐表示法，为音乐的理解和生成提供了一个强大的工具。它不仅能够创作音乐，还能理解和回答音乐理论问题，为音乐教育和创作提供了新的可能性。

Ai平台模型 1970年01月01日 0 点赞 0 评论 333 浏览

IP

一个强大的工具，它通过引入图像提示来增强文本到图像扩散模型的能力。它的设计轻量且高效，易于部署和使用，同时支持广泛的应用场景，包括图像生成、转换和修复。通过解耦的交叉...

Ai平台模型 1970年01月01日 0 点赞 0 评论 316 浏览

微信公众账号

微信扫一扫加关注