多模态 - 智狐AI导航

通义星尘

基于通义大模型设计的一个能够快速创造独有人设、风格的角色对话扮演智能体，可在多种场景中进行多种形式的人工智能互动，广泛应用在角色扮演、教育&服务等领域。

AI写作对话 2025年06月05日 24 点赞 0 评论 918 浏览

MemFree

MemFree是一款开源的混合AI搜索引擎，集成了多种AI技术和搜索引擎功能，支持文本、图像、文件和网页等多种输入形式，可提供文本、思维导图、图片和视频等多格式搜索结果。其核心功能涵盖图像处理、文档总结与提问、学术问题解答、代码解释与生成等，特别适用于学术研究、工作办公和日常生活场景，旨在优化知识管理、提升生产力并降低使用成本。

AI项目与工具 2025年06月12日 42 点赞 0 评论 918 浏览

Grok 3

Grok 3是由马斯克旗下xAI推出的最新AI模型，具备强大的推理能力和多模态处理功能。采用“思维链”技术，支持复杂任务的逐步分析，提升逻辑准确性。模型参数量达1.2万亿，基于10万块H100 GPU训练，性能在多个基准测试中超越同类产品。适用于自动驾驶、医疗、教育、客服及营销等多个领域，提供高效智能解决方案。

AI项目与工具 2025年06月12日 66 点赞 0 评论 918 浏览

VQAScore

VQAScore是一种基于视觉问答（VQA）模型的评估工具，用于衡量文本提示生成图像的质量。它通过计算回答“是”概率的方式评估图像与文本提示的对齐程度，无需额外标注，提供更精确的结果。VQAScore支持多种生成任务，包括图像、视频及3D模型，并能作为多模态学习的研究工具，在自动化测试和质量控制中发挥重要作用。

AI项目与工具 2025年06月12日 86 点赞 0 评论 917 浏览

基石智算

基石智算是青云科技推出的AI算力云服务平台，支持多种异构算力资源的统一调度与管理，具备弹性扩容、分布式任务调度、一站式AI开发及模型部署等功能。平台适用于AI模型训练、高性能计算、数据科学分析及模型推理等多种场景，提供灵活的服务模式和全面的资源监控与管理能力，助力用户高效开展人工智能相关工作。

AI项目与工具 2025年06月11日 49 点赞 0 评论 917 浏览

海螺视频APP

海螺视频APP是一款基于AI技术的视频生成工具，支持文生视频和图生视频功能，提供丰富的镜头控制选项，让用户能像专业导演一样创作动态视频。该工具适用于多种场景，如社交媒体、广告营销、影视制作等，操作简便，适合各类用户使用。

AI项目与工具 2025年06月12日 21 点赞 0 评论 917 浏览

Mind GPT

Mind GPT-3o是一款由理想汽车推出的大规模多模态端到端人工智能模型，集成了语音、视觉与语言理解技术，具备记忆、规划、工具集成及表达能力。它不仅能理解复杂信息，还能提供个性化服务，如智能驾驶辅助、家居设备控制、日程管理和健康咨询等。通过强化逻辑推理与上下文理解，该模型实现了从感知到表达的智能化跨越，为用户提供全面的支持。

AI项目与工具 2025年06月12日 65 点赞 0 评论 917 浏览

QLIP

QLIP是一种基于二进制球形量化（BSQ）的视觉标记化方法，具备高质量图像重建和零样本图像理解能力。通过对比学习目标和两阶段训练策略，QLIP可作为视觉编码器或图像标记器，广泛应用于多模态任务，如文本到图像生成、图像到文本生成及多模态理解。其技术设计提升了模型的语义表达与训练效率，为统一多模态模型的开发提供了新思路。

AI项目与工具 2025年06月11日 18 点赞 0 评论 917 浏览

Matrix3D

Matrix3D 是一种由多所高校与科技企业联合开发的统一摄影测量模型，集姿态估计、深度预测、新视图合成与3D重建于一体。其核心技术为多模态扩散变换器，支持跨模态数据融合与灵活任务处理。通过掩码学习策略，提高数据利用效率并增强模型泛化能力。适用于VR/AR、游戏开发、影视制作等领域，具有高度交互性和灵活性。

AI项目与工具 2025年06月12日 49 点赞 0 评论 915 浏览

Zulu

Zulu 是百度文心快码推出的多模态 AI 编程助手，支持从自然语言需求到代码的端到端生成。具备智能任务拆解、多文件编辑、实时预览、多模态输入及多 IDE 适配等功能，适用于开发者、学习者及各类技术岗位，有效提升开发效率和代码质量。

AI项目与工具 2025年06月12日 59 点赞 0 评论 912 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期