多模态 - 智狐AI导航

ChatPDFLocal

一款专为Mac用户设计的本地PDF阅读和处理工具，它结合了原生 macOS 界面和强大的大型语言模型（LLM），能够快速、安全地处理 PDF 文件。

Ai办公效率 2025年06月05日 72 点赞 0 评论 724 浏览

HMoE

HMoE（混合异构专家模型）是腾讯混元团队提出的一种新型神经网络架构，旨在提升大型语言模型的性能和计算效率。通过引入不同规模的专家来处理不同复杂度的输入数据，HMoE增强了模型的专业化程度，并采用了新的训练目标和策略，如P-Penalty Loss，以提高参数利用率和计算效率。HMoE在多个预训练评估基准上表现出色，适用于自然语言处理、内容推荐、语音识别、图像和视频分析以及多模态学习等领域。

AI项目与工具 2025年06月12日 90 点赞 0 评论 724 浏览

WorldDreamer

WorldDreamer 是一种基于 Transformer 的通用世界模型，具备理解与预测物理世界动态变化的能力，专注于视频生成任务。它支持多种应用场景，包括文本到视频、图像到视频、视频编辑和动作序列生成，利用视觉 Token 化、Transformer 架构和多模态提示技术，实现了高效且高质量的视频生成。

AI项目与工具 2025年06月12日 16 点赞 0 评论 723 浏览

文心大模型4.5

文心大模型4.5是百度推出的原生多模态大模型，具备强大的多模态理解、逻辑推理和文本生成能力。支持文字、图片、音频、视频等多种信息的综合处理，适用于教育、内容创作、智能客服及金融等领域。模型已上线百度智能云平台，企业与开发者可通过API调用，满足多样化业务需求。

AI项目与工具 2025年06月12日 32 点赞 0 评论 722 浏览

阿帕斯大模型

阿帕斯大模型是APUS公司推出的以人工智能技术为核心的多模态大模型，它通过提供行业定制化的AI解决方案和创意工具，致力于帮助全球用户实现更优质的移动互联网使用体验和创造个性...

创作工具 1970年01月01日 0 点赞 0 评论 719 浏览

TableGPT2

TableGPT2是一种由浙江大学开发的多模态人工智能模型，专注于结构化数据的处理与分析。它具备强大的表格数据理解能力，支持SQL查询执行、数据分析以及数据增删改查等功能。通过创新的表格编码器和双维注意力机制，TableGPT2在处理不规则表格和模糊查询方面表现优异。其应用场景广泛，涵盖商业智能、财务分析、市场研究及供应链管理等领域。

AI项目与工具 2025年06月12日 34 点赞 0 评论 719 浏览

书生·万象InternVL 2.5

书生·万象InternVL 2.5是一款开源多模态大型语言模型，基于InternVL 2.0升级而来。它涵盖了从1B到78B不同规模的模型，支持多种应用场景，包括图像和视频分析、视觉问答、文档理解和信息检索等。InternVL 2.5在多模态理解基准上表现优异，性能超越部分商业模型，并通过链式思考技术提升多模态推理能力。

AI项目与工具 2025年06月12日 100 点赞 0 评论 718 浏览

LazyLLM

LazyLLM 是一款开源的低代码平台，用于高效构建多智能体大语言模型应用。它支持低代码开发、多智能体架构、模型微调、一键部署、跨平台运行及多模态扩展等功能，适用于聊天机器人、RAG、故事创作和AI绘画等多种场景。其核心采用数据流驱动和模块化设计，提升开发效率和灵活性。

AI项目与工具 2025年06月12日 30 点赞 0 评论 717 浏览

ChatWise

ChatWise 是一款支持多种语言模型的 AI 聊天工具，提供多模态交互功能，支持音频、PDF、图片和文本文件处理。其桌面优化设计提升体验，数据本地存储保障隐私。内置网页搜索功能，支持连接 Notion、Google Sheets 等外部工具，适用于学习、办公、内容创作等场景。

AI项目与工具 2025年06月11日 100 点赞 0 评论 717 浏览

MagicQuill

MagicQuill是一款基于AI的开源图像编辑工具，提供智能化的局部编辑功能。其核心功能包括AI驱动的智能建议、精确的像素级编辑（如添加、删除和颜色调整），以及多种定制化工具（如添加笔刷、减去笔刷和颜色笔刷）。此外，它还具备实时意图预测和参数调整能力，支持多模态大语言模型和扩散模型的协作，适用于个人娱乐、教育、专业设计及商业应用等多个领域。

AI项目与工具 2025年06月12日 85 点赞 0 评论 716 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期