多模态 - 智狐AI导航

OmniThink

OmniThink是由浙江大学与阿里巴巴通义实验室联合开发的机器写作框架，通过模拟人类学习和反思机制，提升文章的知识密度与深度。支持多种语言模型，具备信息树与概念池结构化管理功能，适用于学术写作、新闻报道、教育内容创作等多个领域，有效提高生成内容的质量与多样性。

AI项目与工具 2025年06月12日 10 点赞 0 评论 490 浏览

天翼AI开放平台

天翼AI开放平台是中国电信推出的AI技术服务平台，基于自研星辰大模型，提供问答、表格分析、文生图、多方言识别等功能，同时为企业提供大模型开发、AI中台等工具，覆盖政务、金融、工业等领域，支持多场景数字化创新。

AI项目与工具 2025年06月11日 71 点赞 0 评论 490 浏览

LibreChat

一个开源多模态AI对话平台，它支持与多种AI模型服务的集成，包括OpenAI、Azure、Anthropic和Google等。

AI写作对话 2025年06月05日 92 点赞 0 评论 488 浏览

Neural4D 2o

Neural4D 2o 是一款基于多模态数据训练的 3D 大模型，支持文本、图像、3D 和运动数据输入，实现高精度的 3D 内容生成与编辑。具备上下文一致性、角色身份保持、换装和风格迁移等功能，支持自然语言指令操作。采用 Transformer 编码器与 3D DiT 解码器架构，原生兼容 MCP 协议，提升创作效率与交互体验，适用于 3D 内容创作、游戏开发、影视动画等多个领域。

AI项目与工具 2025年06月11日 50 点赞 0 评论 488 浏览

ManusAI

全球首款通用型AI智能体，ManusAI通过自主任务执行、动态任务拆解、多模态交互和跨平台执行等能力，帮助用户高效完成复杂任务。

Ai平台模型 2025年06月05日 95 点赞 0 评论 487 浏览

LongVU

LongVU是一款由Meta AI团队研发的长视频理解工具，其核心在于时空自适应压缩机制，可有效减少视频标记数量并保留关键视觉细节。该工具通过跨模态查询与帧间依赖性分析，实现了对冗余帧的剔除及帧特征的选择性降低，并基于时间依赖性进一步压缩空间标记。LongVU支持高效处理长视频，适用于视频内容分析、搜索索引、生成描述等多种应用场景。

AI项目与工具 2025年06月12日 65 点赞 0 评论 487 浏览

VSI

VSI-Bench是一种用于评估多模态大型语言模型（MLLMs）视觉空间智能的基准测试工具，包含超过5000个问题-答案对，覆盖多种真实室内场景视频。其任务类型包括配置型任务、测量估计和时空任务，可全面评估模型的空间认知、理解和记忆能力，并提供标准化的测试集用于模型性能对比。 ---

AI项目与工具 2025年06月12日 10 点赞 0 评论 485 浏览

SmolVLA

SmolVLA是Hugging Face开源的轻量级视觉-语言-行动（VLA）模型，专为经济高效的机器人设计。拥有4.5亿参数，可在CPU上运行，单个消费级GPU即可训练，适合在MacBook上部署。它能够处理多模态输入，生成动作序列，并通过异步推理提高控制效率。适用于物体抓取、家务劳动、货物搬运和机器人教育等场景。

AI项目与工具 2025年06月11日 34 点赞 0 评论 485 浏览

IMYAI智能助手

原名ILoveChatGPT，为用户提供丰富的AI服务，使用IMYAI，无需额外工具，即可让您畅享ChatGPT以及Midjourney等AI服务。

Ai平台模型 2025年06月05日 12 点赞 0 评论 485 浏览

食神

食神是老板电器研发的烹饪领域AI大模型，基于46年烹饪数据与DeepSeek技术，可精准理解用户需求。支持语音、文字交互，提供个性化菜谱推荐、健康膳食规划，并能与智能厨电联动，实现烹饪全流程自动化。同时具备文化讲解与情感陪伴功能，提升用户体验。适用于家庭烹饪、健康管理及文化体验等多个场景。

AI项目与工具 2025年06月12日 48 点赞 0 评论 482 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期