多模态 - 智狐AI导航

HuggingSnap

HuggingSnap 是一款基于 Hugging Face 的 AI 助手应用，采用轻量级多模态模型 SmolVLM2，支持图像、视频和文本的本地处理与生成。具备即时视觉描述、多语言文字识别与翻译、隐私保护等功能，适用于旅行、日常辅助、医疗及零售等场景，确保用户数据安全。

AI项目与工具 2025年06月12日 23 点赞 0 评论 547 浏览

Ichigo

Ichigo是一款开源的多模态AI语音助手，采用混合模态模型，支持实时处理语音和文本交织序列。它通过统一的Transformer架构实现跨模态联合推理，提供低延迟的实时性能，并支持多语言、多轮对话及模糊输入处理。Ichigo适用于智能家居、个人助理、客户服务、教育和健康咨询等多种应用场景，展现了高效、灵活的技术优势。

AI项目与工具 2025年06月12日 96 点赞 0 评论 548 浏览

BetterYeah

斑头雁BattleYeah AI，AI机器人构建平台，简单、易用、全新交互形式，API无缝集成至企业系统，帮助企业实现AI生产力革命。

Ai平台模型 2025年06月05日 67 点赞 0 评论 548 浏览

Mistral Medium 3

Mistral Medium 3是Mistral AI推出的一款多模态语言模型，兼具高性能与低成本优势，适用于企业级应用。支持混合云部署、定制化微调及多模态任务处理，可广泛应用于编程辅助、智能客服、数据分析及知识管理等领域，具备良好的扩展性和系统集成能力。

AI项目与工具 2025年06月11日 76 点赞 0 评论 548 浏览

MiniMax

MiniMax-01是由MiniMax推出的高性能AI模型系列，包含语言模型MiniMax-Text-01和视觉多模态模型MiniMax-VL-01。该系列采用线性注意力机制，支持处理长达400万token的上下文，性能接近国际领先模型。具备强大的语言理解、多模态处理及长文本分析能力，适用于企业、教育、科研及开发等多个领域。API定价合理，提供高效的长文本处理与多模态交互解决方案。

AI项目与工具 2025年06月12日 30 点赞 0 评论 550 浏览

Gemma 3 QAT

Gemma 3 QAT 是谷歌推出的开源 AI 模型，采用量化感知训练技术，在降低显存需求的同时保持高性能。它支持多模态任务，具备 128,000-token 长上下文处理能力，并可在消费级 GPU 和边缘设备上运行。适用于视觉问答、文档分析、长文本生成等场景，同时兼容多种推理框架，便于部署。

AI项目与工具 2025年06月11日 44 点赞 0 评论 551 浏览

山海大模型

山海大模型是一款由云知声推出的多模态人工智能模型，具备强大的知识储备和多模态交互能力。它能够通过文本、音频和图像等形式与用户进行实时互动，提供信息查询、知识学习和灵感激发等服务。主要功能包括内容生成与理解、知识问答、逻辑推理、代码能力以及多模态交互特色，如实时响应、情绪感知、音色切换和视觉场景理解。该模型可应用于智能客服、教育辅助、医疗咨询、个人助理和内容创作等多个领域。

AI项目与工具 2025年06月12日 55 点赞 0 评论 553 浏览

Oryx

Oryx是一款由清华大学、腾讯和南洋理工大学联合开发的多模态大型语言模型，专为处理视觉数据设计。其核心技术包括预训练的OryxViT模型和动态压缩模块，支持任意分辨率的图像处理及高效的视觉数据压缩。Oryx在空间和时间理解上表现优异，广泛应用于智能监控、自动驾驶、人机交互、内容审核、视频编辑及教育等领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 554 浏览

瑞智病理大模型

瑞智病理大模型（RuiPath）是由上海交通大学医学院附属瑞金医院与华为联合开发的国产多模态病理诊断系统，覆盖中国90%的常见癌种及部分罕见病。通过整合图像、文本等多源数据，实现高效、精准的辅助诊断，支持交互式审核流程，提升诊断效率与准确性。模型基于深度学习与华为DCS AI平台，适用于临床诊断、基层医疗、医学教育等多个场景，推动病理诊断智能化发展。

AI项目与工具 2025年06月12日 95 点赞 0 评论 554 浏览

SpeechGPT 2.0

SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队开发的拟人化实时交互系统，基于大量中文语音数据训练，支持低延迟、高自然度的语音与文本交互。具备情感控制、实时打断、多风格语音生成等功能，适用于智能助手、内容创作及无障碍通信等场景，技术上融合了语音-文本联合建模与多阶段训练策略，提升语音表现力与智能化水平。

AI项目与工具 2025年06月12日 23 点赞 0 评论 554 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期