多模态 - 智狐AI导航

QVQ

QVQ是一个基于Qwen2-VL-72B的开源多模态推理模型，擅长处理文本、图像等多模态数据，具备强大的视觉理解和复杂问题解决能力。它在数学和科学领域的视觉推理任务中表现出色，但在实际应用中仍需解决语言切换、递归推理及图像细节关注等问题。QVQ可广泛应用于教育、自动驾驶、医疗图像分析、安全监控及客户服务等领域。

AI项目与工具 2025年06月12日 70 点赞 0 评论 644 浏览

Klavis AI

Klavis AI 是一个基于 MCP 协议的开源平台，提供稳定可靠的 MCP 服务器和多客户端集成能力。支持多种工具定制化配置，内置身份验证功能，保障安全性。平台采用分布式架构，适用于大规模用户场景，并通过 API 实现灵活部署与管理，适用于 AI 开发、数据处理、内容创作及企业协作等多种应用场景。

AI项目与工具 2025年06月11日 23 点赞 0 评论 644 浏览

Show

Show-o 是一款基于统一 Transformer 架构的多模态 AI 工具，集成了自回归和离散扩散建模技术，可高效处理视觉问答、文本到图像生成、图像修复与扩展以及混合模态生成等多种任务。其创新性技术显著提高了生成效率，减少了采样步骤，适用于社交媒体内容创作、虚拟助手、教育与培训、广告营销、游戏开发及影视制作等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 645 浏览

Awesome Chinese LLM

整理了开源的中文大语言模型（LLM），主要关注规模较小、可私有化部署且训练成本较低的模型，目前已收录了100多个相关资源。

Ai学习资源 2025年06月05日 44 点赞 0 评论 645 浏览

元镜

元镜是一款基于人机共生引擎的AI视频创作工具，支持从创意脚本生成到成片输出的全流程制作。具备多模态分镜设计、智能工作流和一键成片功能，提升视频创作效率与质量。适用于短视频、广告、教育、影视及政务宣传等多个领域，满足多样化内容生产需求。

AI项目与工具 2025年06月12日 39 点赞 0 评论 647 浏览

AI教师助手

AI教师助手是北京外研在线数字科技有限公司推出的一款多功能教学辅助工具，它通过智能化技术帮助教师提高教学效率，同时也为学生提供个性化的学习体验。

创作工具 2026年07月28日 0 点赞 0 评论 648 浏览

LangGraph WhatsApp Agent

LangGraph WhatsApp Agent 是一个开源 AI 工具，用于在 WhatsApp 上构建智能代理。支持多代理架构、多模态交互及持久化对话状态，集成多种语言模型，提供安全可靠的通信环境。适用于客户服务、信息推送、教育辅导等多个场景，便于开发者快速构建和部署高效的 WhatsApp 机器人。

AI项目与工具 2025年06月11日 59 点赞 0 评论 648 浏览

JanusFlow

JanusFlow是一款集成了自回归语言模型与校正流技术的多模态AI模型，能够在单一框架内高效完成图像理解和生成任务。它通过解耦视觉编码器和表示对齐策略，显著提升了模型在视觉理解与图像生成上的表现，广泛应用于图像生成、多模态内容创作、视觉问答、图像理解和辅助设计等多个领域。

AI项目与工具 2025年06月12日 20 点赞 0 评论 648 浏览

Amazon Nova Premier

Amazon Nova Premier 是亚马逊推出的多模态 AI 模型，支持文本、图像和视频输入，具备超长上下文处理能力（最高达 100 万 token），适用于复杂任务处理、多步骤规划与跨数据源执行。可通过模型蒸馏生成轻量级版本，优化生产部署。支持多语言，具备安全控制机制，广泛应用于金融、法律、软件开发等领域。

AI项目与工具 2025年06月11日 39 点赞 0 评论 649 浏览

AI Now

AI Now是一款由联想推出的个人AI助手，内置Meta Llama 3等本地大型语言模型，支持自然语言交互、内容生成、设备管理和跨设备数据传输等功能。它注重数据安全与隐私保护，通过本地加密和个人知识库实现全面的数据控制。AI Now适用于个人助理、教育辅导、办公自动化、内容创作以及客户服务等多种应用场景，旨在提高用户的工作效率和生活质量。

AI项目与工具 2025年06月12日 80 点赞 0 评论 649 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期

QVQ