多模态 - 智狐AI导航

Open Avatar Chat

Open Avatar Chat是阿里开源的模块化实时数字人对话系统，支持低延迟交互与多模态输入输出。系统采用模块化架构，允许灵活配置语音识别、语言模型和语音合成等组件，兼容本地与云服务。支持2D/3D数字人渲染，适用于客户服务、教育、娱乐及企业应用等多个场景，为开发者提供高效、灵活的AI对话解决方案。

AI项目与工具 2025年06月11日 81 点赞 0 评论 627 浏览

FluxMusic

FluxMusic 是一个开源的音乐生成工具，能够将文本描述转化为音乐。它采用先进的扩散模型和Transformer架构，通过修正流技术提高音乐的自然度和质量。该工具支持多种规模的模型，具备文本到音乐生成、语义理解、多模态融合等功能，适用于音乐创作、影视配乐、游戏音乐生成等多种场景。

AI项目与工具 2025年06月12日 66 点赞 0 评论 626 浏览

Hali

Hali是一款由特斯联与Buttons合作开发的多模态多智能体协作AI助手，具有类人化思考、长期记忆、物理环境感知及多智能体协同能力。它支持个性化服务，包括日程管理、翻译、智能家居控制、健康建议以及娱乐推荐等功能，适用于个人助理、商务沟通、家庭管理和健康生活等多个领域。

AI项目与工具 2025年06月12日 91 点赞 0 评论 626 浏览

MobA

MobA是一种基于多模态大型语言模型的移动智能体，通过高级全局智能体（GA）和低级局部智能体（LA）的两级架构，实现任务规划、分解与执行，支持跨应用操作和自动化流程。其反思模块助力高效处理复杂任务，广泛应用于个人助理、智能家居控制、移动设备自动化及教育等领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 625 浏览

MCP万能工具箱

MCP万能工具箱是一个基于MCP开放协议的AI工具集成平台，提供近百款免费工具，覆盖办公、金融、数据处理等场景。支持一键调用多种功能，如财报解析、投资建议、地图导航等，并集成多个主流大模型。用户无需编程即可创建个性化智能体，提升工作效率与决策能力。平台具备安全机制，兼容多系统，适用于办公自动化、金融分析及专业领域支持等多种应用。

AI项目与工具 2025年06月11日 100 点赞 0 评论 624 浏览

阶跃星辰

一家专注于人工智能领域的创新公司，阶跃星辰以“智能阶跃，十倍每一个人的可能”为使命，旨在实现通用人工智能（AGI）。

Ai平台模型 2025年06月05日 34 点赞 0 评论 624 浏览

Gemma 3n

Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型，基于 Gemini Nano 架构，采用逐层嵌入技术，将内存占用压缩至 2-4B 参数模型水平。支持文本、图像、短视频和音频输入，可生成结构化文本输出，并具备音频转录、情感分析等功能。可在本地设备运行，响应时间低至 50 毫秒，适用于语音助手、内容生成和学术任务定制。

AI项目与工具 2025年06月11日 87 点赞 0 评论 623 浏览

Being

Being-M0是由北京大学、中国人民大学等机构联合研发的首个大规模人形机器人通用动作生成模型。基于百万级动作数据集 MotionLib 和 MotionBook 编码技术，实现动作序列的高效表示与生成。该模型支持文本驱动动作生成、动作迁移及多模态数据处理，可应用于人形机器人控制、动画制作、VR/AR、人机交互及运动康复等多个领域，显著提升动作生成的多样性和语义对齐精度。

AI项目与工具 2025年06月11日 13 点赞 0 评论 623 浏览

蜜巢政务大模型

蜜巢为蜜度自主研发的政务大模型，在研发工作中，构建了Token数超1万亿、中文内容占比超75%的高质量语料数据集用于预训练工作。

创作工具 1970年01月01日 0 点赞 0 评论 622 浏览

OlympicArena

OlympicArena是由多所高校与研究机构联合开发的多学科认知推理基准测试框架，包含11,163道国际奥赛双语题目，覆盖数学、物理、化学、生物、地理、天文学和计算机科学等7大领域。该平台通过答案级与过程级评估，全面衡量AI模型的逻辑与视觉推理能力，支持多模态输入并具备数据泄漏检测机制，适用于AI模型评估、训练优化、教育辅助及科研应用。

AI项目与工具 2025年06月12日 58 点赞 0 评论 621 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期