多模态 - 智狐AI导航

Data Agent

Data Agent是由火山引擎推出的智能数据分析工具，支持结构化与非结构化数据的整合与分析，提供智能对话查询、多模态分析及自动报告生成等功能。它能够优化企业营销策略、提升客户管理效率，并支持实时监控与风险预警，适用于决策支持、营销优化、客户管理等多个业务场景，帮助企业实现数据驱动的高效运营。

AI项目与工具 2025年06月12日 29 点赞 0 评论 725 浏览

Flame

Flame是一款开源的多模态AI模型，能够将UI设计截图转换为高质量的现代前端代码。它支持React等主流框架，具备动态交互、组件化开发和高代码质量的特点。Flame通过创新的数据合成方法提升代码多样性与准确性，适用于快速原型开发、提升开发效率及辅助学习等多种场景。其训练数据、模型和测试集均已开源，为前端开发提供了高效的工具支持。

AI项目与工具 2025年06月12日 87 点赞 0 评论 726 浏览

办公小浣熊2.0

办公小浣熊2.0是一款由商汤科技开发的AI办公助手，其核心功能围绕“浣熊三步法”展开，涵盖规划、分析与写作三大模块。该工具支持个人知识库建设、信息检索、文档编辑及对话转文档等功能，尤其擅长无编程数据分析与文档解析，同时提供内容生成、校对、创意辅助等服务，广泛应用于办公、学习、研究及项目管理等领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 726 浏览

GCDance

GCDance是一款由英国萨里大学与江南大学联合开发的3D舞蹈生成框架，可根据音乐和文本提示生成风格可控的全身舞蹈序列。它结合多粒度音乐特征融合与CLIP模型文本嵌入技术，实现舞蹈动作与音乐节奏的高度同步。支持多种舞蹈风格生成、局部编辑及高质量全身动作输出，适用于VR、游戏开发、舞蹈教学等场景。

AI项目与工具 2025年06月12日 36 点赞 0 评论 727 浏览

理想同学

理想同学是一款基于AI技术打造的智能助手，集成了知识问答、视觉识别、绘画创作和播客等多种功能。它支持多领域的信息查询、语言翻译、文本生成及视觉分析，通过跨平台协作实现数据同步与连续对话。此外，用户可根据需求选择不同模型以优化推理能力，广泛适用于日常生活、学习和工作场景。

AI项目与工具 2025年06月12日 96 点赞 0 评论 727 浏览

智谱AutoGLM Web

基于智谱开发的AutoGLM，是由智谱AI团队开发的先进AI智能体，它专为模拟人类操作手机和网页而设计，能够理解屏幕界面信息。

GPTs应用 2025年06月05日 21 点赞 0 评论 728 浏览

TinyVLA

TinyVLA是一种轻量级的视觉-语言-动作（VLA）模型，专为机器人操控设计。它通过结合多模态模型和扩散策略解码器，实现了快速推理、数据高效和多任务学习的能力，并在泛化性能上表现优异。TinyVLA可应用于家庭、工业、服务等多个领域，具有广泛的实用价值。

AI项目与工具 2025年06月12日 91 点赞 0 评论 728 浏览

度豆APP

百度推出的一款AI数字人社交App，度豆的AI数字人不仅能够理解并回应用户的文字、语音和图片信息，能让你跟数字人聊天就像跟真人一样自然

Ai视频生成 2025年06月05日 97 点赞 0 评论 728 浏览

蓝心大模型

蓝心大模型是由vivo研发的通用大模型矩阵，包括语言、端侧、语音、图像及多模态模型。该模型在内容创作、知识问答、逻辑推理、代码生成、信息提取、多语言翻译等方面表现出色。蓝心端侧大模型3B在移动设备上表现出色，蓝心语音大模型支持多语言，蓝心图像大模型融合了中国特色和东方美学，蓝心多模态大模型则提供了流畅的视频对话体验。

AI项目与工具 2025年06月12日 76 点赞 0 评论 729 浏览

SlideChat

SlideChat是一款先进的视觉语言助手，专注于处理和分析千兆像素级别的全切片病理图像。它具备强大的多模态对话能力和复杂指令响应能力，在显微镜检查、诊断等领域展现出卓越性能。通过两阶段训练机制，SlideChat实现了视觉与语言特征的有效对齐，并被广泛应用于病理诊断、医学教育、研究开发以及临床决策支持。 ---

AI项目与工具 2025年06月12日 10 点赞 0 评论 731 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期