多模态 - 智狐AI导航

Kanana

Kanana是一款由Kakao推出的生成式AI助手，具备强大的上下文理解和记忆能力。其核心功能包括群聊助手（Kana）和私人伴侣（Nana），前者专注于处理团队协作中的具体任务，后者则用于管理个人及集体事务。此外，该工具还支持多模态输入输出方式，可应用于商务、教育、社交等多个领域，并计划扩展至车载场景以提升用户体验。

AI项目与工具 2025年05月07日 20 点赞 0 评论 828 浏览

MnnLlmApp

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开发的开源 Android 应用，支持多种大语言模型在本地运行。具备多模态交互能力，可处理文本、图像、音频等多种输入输出任务。应用经过 CPU 推理优化，运行效率高，支持离线使用，保障数据安全。内置 Qwen、Gemma、Llama 等主流模型，适用于内容创作、智能助手、语言学习及创意设计等多种场景。

AI项目与工具 2025年06月12日 60 点赞 0 评论 829 浏览

MiniCPM

MiniCPM-o 2.6 是一款高性能的多模态大模型，具备 8B 参数量，支持视觉、语音及多模态直播等多种功能。其在图像处理、语音识别和实时交互方面表现优异，采用高效的 token 技术提升推理速度，可在端侧设备上运行。支持多种语言和音色配置，适用于智能助手、内容创作、教育、客服和医疗等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 829 浏览

优雅YOYA

优雅（YOYA）是中科闻歌推出的多模态文生视频平台，基于大语言模型和多模态技术，支持从脚本生成到视频剪辑的全流程自动化。用户仅需输入主题，即可快速生成高质量视频，并支持语音克隆、口型翻译、数字人等功能。平台还具备多模态素材智能剪辑能力，提升创作效率与可控性，适用于媒体、影视、企业宣传及教育等领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 830 浏览

ViDoRAG

ViDoRAG是阿里巴巴通义实验室联合高校开发的视觉文档检索增强生成框架，采用多智能体协作与动态迭代推理技术，提升复杂文档的检索与理解能力。通过高斯混合模型优化多模态信息整合，支持精准检索与高质量生成，适用于教育、金融、医疗等多个领域，显著提升文档处理效率与准确性。

AI项目与工具 2025年06月12日 26 点赞 0 评论 830 浏览

OpenBioMed

OpenBioMed是由清华大学智能产业研究院与水木分子联合开发的开源平台，专注于AI在生物医学中的应用。它支持多模态数据处理，涵盖分子、蛋白质、单细胞等多种类型，并提供20多个深度学习模型和计算工具，适用于药物研发、精准医疗、知识图谱构建等领域。平台具备统一的数据处理框架和预训练模型，支持快速迁移和智能体设计，助力科研人员提升研究效率。

AI项目与工具 2025年06月12日 45 点赞 0 评论 830 浏览

ShowUI

ShowUI是一款由新加坡国立大学Show Lab与微软合作开发的视觉-语言-行动模型，旨在提升图形用户界面（GUI）助手的工作效率。该模型通过UI引导的视觉令牌选择、交错视觉-语言-行动流以及高质量数据集的运用，实现了高效的零样本截图定位和GUI自动化功能，广泛应用于网页自动化、移动应用测试、桌面软件自动化及游戏自动化等领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 831 浏览

PixWeaver

PixWeaver是一个基于人工智能的图像创作平台。它能帮助用户无需学习复杂的设计软件,通过语音或文字描述就可以生成理想中的图像。

Ai绘画生成 2025年06月05日 47 点赞 0 评论 832 浏览

Go Charlie

一款AI营销助手，帮助企业家和企业快速轻松地创建和发布内容，Go Charlie可帮助您在几秒钟内创建图像、博客、广告、影响者帖子等。

创业营销 2025年06月05日 80 点赞 0 评论 833 浏览

ChatPDFLocal

一款专为Mac用户设计的本地PDF阅读和处理工具，它结合了原生 macOS 界面和强大的大型语言模型（LLM），能够快速、安全地处理 PDF 文件。

Ai办公效率 2025年06月05日 72 点赞 0 评论 834 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期