多模态 - 智狐AI导航

Augmented Physics

Augmented Physics是一款基于人工智能的教育工具，旨在通过计算机视觉技术和多模态语言模型，将物理教科书中的静态图表转化为动态交互式模拟，帮助学生更好地理解物理概念。它支持多种仿真类型，包括光学、运动学和电路等，并提供动态可视化和动画效果，同时无需编程技能即可创建仿真。

AI项目与工具 2025年06月12日 71 点赞 0 评论 862 浏览

Hummingbird

Hummingbird-0 是一款基于深度学习的 AI 口型同步工具，支持零样本学习，无需额外训练即可快速生成高质量口型同步视频。它兼容多种格式，支持最长 5 分钟视频处理，1 分钟内生成 10 秒视频，适用于影视制作、广告、本地化翻译及 AI 内容创作等场景。通过多模态融合技术，实现音频与视频的精准匹配，提升内容表现力。

AI项目与工具 2025年06月11日 42 点赞 0 评论 863 浏览

书生通用大模型

上海人工智能实验室发布的大型预训练模型。

Ai平台模型 2025年06月05日 68 点赞 0 评论 863 浏览

西湖大模型

西湖大模型西湖心辰开发的多模态大模型，既具备通过跨领域的知识解决问题的超高智商，也具备通过情感感知、长期记忆形成的超高情商。

Ai平台模型 2026年07月28日 0 点赞 0 评论 864 浏览

文心大模型4.5

文心大模型4.5是百度推出的原生多模态大模型，具备强大的多模态理解、逻辑推理和文本生成能力。支持文字、图片、音频、视频等多种信息的综合处理，适用于教育、内容创作、智能客服及金融等领域。模型已上线百度智能云平台，企业与开发者可通过API调用，满足多样化业务需求。

AI项目与工具 2025年06月12日 32 点赞 0 评论 866 浏览

HMoE

HMoE（混合异构专家模型）是腾讯混元团队提出的一种新型神经网络架构，旨在提升大型语言模型的性能和计算效率。通过引入不同规模的专家来处理不同复杂度的输入数据，HMoE增强了模型的专业化程度，并采用了新的训练目标和策略，如P-Penalty Loss，以提高参数利用率和计算效率。HMoE在多个预训练评估基准上表现出色，适用于自然语言处理、内容推荐、语音识别、图像和视频分析以及多模态学习等领域。

AI项目与工具 2025年06月12日 90 点赞 0 评论 867 浏览

办公小浣熊2.0

办公小浣熊2.0是一款由商汤科技开发的AI办公助手，其核心功能围绕“浣熊三步法”展开，涵盖规划、分析与写作三大模块。该工具支持个人知识库建设、信息检索、文档编辑及对话转文档等功能，尤其擅长无编程数据分析与文档解析，同时提供内容生成、校对、创意辅助等服务，广泛应用于办公、学习、研究及项目管理等领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 869 浏览

MM1.5

MM1.5是苹果公司研发的多模态大型语言模型，具备强大的文本与图像理解能力，包括视觉指代、定位及多图像推理功能。它通过数据驱动的训练方法，实现了从1B到30B参数规模的性能提升，并推出了视频和移动UI专用版本，为多模态AI技术发展提供重要参考。主要应用场景涵盖图像与视频理解、视觉搜索、辅助驾驶、智能助手及教育领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 870 浏览

纳米搜索

纳米搜索是一款由360集团开发的多功能AI搜索引擎，支持文字、语音、拍照和视频等多种搜索方式，涵盖从简单到复杂的全方位解答方案。它整合了16款顶尖大模型能力，配备了智能工具，如写作、翻译和旅游规划助手，旨在提升多场景下的操作效率。此外，其独特的AI脱口秀功能，能将搜索结果转化为视频内容，为用户提供更直观的知识获取体验。

AI项目与工具 2025年06月12日 13 点赞 0 评论 871 浏览

理想同学

理想同学是一款基于AI技术打造的智能助手，集成了知识问答、视觉识别、绘画创作和播客等多种功能。它支持多领域的信息查询、语言翻译、文本生成及视觉分析，通过跨平台协作实现数据同步与连续对话。此外，用户可根据需求选择不同模型以优化推理能力，广泛适用于日常生活、学习和工作场景。

AI项目与工具 2025年06月12日 96 点赞 0 评论 871 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期