多模态 - 智狐AI导航

食神

食神是老板电器研发的烹饪领域AI大模型，基于46年烹饪数据与DeepSeek技术，可精准理解用户需求。支持语音、文字交互，提供个性化菜谱推荐、健康膳食规划，并能与智能厨电联动，实现烹饪全流程自动化。同时具备文化讲解与情感陪伴功能，提升用户体验。适用于家庭烹饪、健康管理及文化体验等多个场景。

AI项目与工具 2025年06月12日 48 点赞 0 评论 714 浏览

DICE

DICE-Talk是由复旦大学与腾讯优图实验室联合开发的动态肖像生成框架，能够根据音频和参考图像生成具有情感表达的高质量视频。其核心在于情感与身份的解耦建模，结合情感关联增强和判别机制，确保生成内容的情感一致性与视觉质量。该工具支持多模态输入，具备良好的泛化能力和用户自定义功能，适用于数字人、影视制作、VR/AR、教育及心理健康等多个领域。

AI项目与工具 2025年06月11日 87 点赞 0 评论 713 浏览

Mistral Medium 3

Mistral Medium 3是Mistral AI推出的一款多模态语言模型，兼具高性能与低成本优势，适用于企业级应用。支持混合云部署、定制化微调及多模态任务处理，可广泛应用于编程辅助、智能客服、数据分析及知识管理等领域，具备良好的扩展性和系统集成能力。

AI项目与工具 2025年06月11日 76 点赞 0 评论 712 浏览

OmniThink

OmniThink是由浙江大学与阿里巴巴通义实验室联合开发的机器写作框架，通过模拟人类学习和反思机制，提升文章的知识密度与深度。支持多种语言模型，具备信息树与概念池结构化管理功能，适用于学术写作、新闻报道、教育内容创作等多个领域，有效提高生成内容的质量与多样性。

AI项目与工具 2025年06月12日 10 点赞 0 评论 711 浏览

SmolVLA

SmolVLA是Hugging Face开源的轻量级视觉-语言-行动（VLA）模型，专为经济高效的机器人设计。拥有4.5亿参数，可在CPU上运行，单个消费级GPU即可训练，适合在MacBook上部署。它能够处理多模态输入，生成动作序列，并通过异步推理提高控制效率。适用于物体抓取、家务劳动、货物搬运和机器人教育等场景。

AI项目与工具 2025年06月11日 34 点赞 0 评论 708 浏览

Seed Music

一个强大的音乐生成工具，它通过先进的技术手段，如自回归模型和扩散模型，为用户提供了从音乐创作到编辑再到声音转换的全方位服务。这套系统不仅能够生成高质量的音乐作品，还能...

创作工具 2026年07月28日 0 点赞 0 评论 707 浏览

文心大模型X1 Turbo

文心大模型X1 Turbo是百度推出的深度思考型AI模型，具备强大的逻辑推理和多模态处理能力，适用于内容创作、智能问答、任务规划等多个领域。相比前代产品，性能提升显著，价格更具竞争力，支持复杂场景下的高效应用。

AI项目与工具 2025年06月11日 39 点赞 0 评论 705 浏览

天翼AI开放平台

天翼AI开放平台是中国电信推出的AI技术服务平台，基于自研星辰大模型，提供问答、表格分析、文生图、多方言识别等功能，同时为企业提供大模型开发、AI中台等工具，覆盖政务、金融、工业等领域，支持多场景数字化创新。

AI项目与工具 2025年06月11日 71 点赞 0 评论 705 浏览

Maya

Maya是一款开源多语言多模态模型，基于LLaVA框架开发，支持中文、法语、西班牙语等多种语言，专注于提升低资源语言的AI内容生成能力。它结合图像和文本数据，实现跨模态对齐和指令微调，广泛应用于跨语言内容理解、图像分析、教育和电子商务等领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 705 浏览

SmolDocling

SmolDocling-256M-preview 是一款轻量级多模态文档处理模型，能将图像文档高效转换为结构化文本，支持文本、公式、图表等多种元素识别。模型参数量仅256M，推理速度快，适合学术与技术文档处理。具备OCR、布局识别、格式导出等功能，并兼容Docling，适用于文档数字化、科学研究及移动环境应用。

AI项目与工具 2025年03月22日 98 点赞 0 评论 703 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期

食神