多模态 - 智狐AI导航

MagicQuill

MagicQuill是一款基于AI的开源图像编辑工具，提供智能化的局部编辑功能。其核心功能包括AI驱动的智能建议、精确的像素级编辑（如添加、删除和颜色调整），以及多种定制化工具（如添加笔刷、减去笔刷和颜色笔刷）。此外，它还具备实时意图预测和参数调整能力，支持多模态大语言模型和扩散模型的协作，适用于个人娱乐、教育、专业设计及商业应用等多个领域。

AI项目与工具 2025年06月12日 85 点赞 0 评论 717 浏览

元象XVERSE

元象 XVERSE是国内领先的 AI 与 3D 技术服务公司，致力于打造 AI 驱动的 3D 内容生产与消费一站式平台，愿景为“定义你的世界”。

Ai科技公司 2025年06月05日 82 点赞 0 评论 717 浏览

ChatWise

ChatWise 是一款支持多种语言模型的 AI 聊天工具，提供多模态交互功能，支持音频、PDF、图片和文本文件处理。其桌面优化设计提升体验，数据本地存储保障隐私。内置网页搜索功能，支持连接 Notion、Google Sheets 等外部工具，适用于学习、办公、内容创作等场景。

AI项目与工具 2025年06月11日 100 点赞 0 评论 718 浏览

TableGPT2

TableGPT2是一种由浙江大学开发的多模态人工智能模型，专注于结构化数据的处理与分析。它具备强大的表格数据理解能力，支持SQL查询执行、数据分析以及数据增删改查等功能。通过创新的表格编码器和双维注意力机制，TableGPT2在处理不规则表格和模糊查询方面表现优异。其应用场景广泛，涵盖商业智能、财务分析、市场研究及供应链管理等领域。

AI项目与工具 2025年06月12日 34 点赞 0 评论 719 浏览

书生·万象InternVL 2.5

书生·万象InternVL 2.5是一款开源多模态大型语言模型，基于InternVL 2.0升级而来。它涵盖了从1B到78B不同规模的模型，支持多种应用场景，包括图像和视频分析、视觉问答、文档理解和信息检索等。InternVL 2.5在多模态理解基准上表现优异，性能超越部分商业模型，并通过链式思考技术提升多模态推理能力。

AI项目与工具 2025年06月12日 100 点赞 0 评论 719 浏览

阿帕斯大模型

阿帕斯大模型是APUS公司推出的以人工智能技术为核心的多模态大模型，它通过提供行业定制化的AI解决方案和创意工具，致力于帮助全球用户实现更优质的移动互联网使用体验和创造个性...

创作工具 1970年01月01日 0 点赞 0 评论 720 浏览

文心大模型4.5

文心大模型4.5是百度推出的原生多模态大模型，具备强大的多模态理解、逻辑推理和文本生成能力。支持文字、图片、音频、视频等多种信息的综合处理，适用于教育、内容创作、智能客服及金融等领域。模型已上线百度智能云平台，企业与开发者可通过API调用，满足多样化业务需求。

AI项目与工具 2025年06月12日 32 点赞 0 评论 722 浏览

WorldDreamer

WorldDreamer 是一种基于 Transformer 的通用世界模型，具备理解与预测物理世界动态变化的能力，专注于视频生成任务。它支持多种应用场景，包括文本到视频、图像到视频、视频编辑和动作序列生成，利用视觉 Token 化、Transformer 架构和多模态提示技术，实现了高效且高质量的视频生成。

AI项目与工具 2025年06月12日 16 点赞 0 评论 724 浏览

ChatPDFLocal

一款专为Mac用户设计的本地PDF阅读和处理工具，它结合了原生 macOS 界面和强大的大型语言模型（LLM），能够快速、安全地处理 PDF 文件。

Ai办公效率 2025年06月05日 72 点赞 0 评论 724 浏览

Data Agent

Data Agent是由火山引擎推出的智能数据分析工具，支持结构化与非结构化数据的整合与分析，提供智能对话查询、多模态分析及自动报告生成等功能。它能够优化企业营销策略、提升客户管理效率，并支持实时监控与风险预警，适用于决策支持、营销优化、客户管理等多个业务场景，帮助企业实现数据驱动的高效运营。

AI项目与工具 2025年06月12日 29 点赞 0 评论 726 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期