多模态 - 智狐AI导航

Being

Being-M0是由北京大学、中国人民大学等机构联合研发的首个大规模人形机器人通用动作生成模型。基于百万级动作数据集 MotionLib 和 MotionBook 编码技术，实现动作序列的高效表示与生成。该模型支持文本驱动动作生成、动作迁移及多模态数据处理，可应用于人形机器人控制、动画制作、VR/AR、人机交互及运动康复等多个领域，显著提升动作生成的多样性和语义对齐精度。

AI项目与工具 2025年06月11日 13 点赞 0 评论 623 浏览

R1

R1-Onevision 是一款基于 Qwen2.5-VL 微调的开源多模态大语言模型，擅长处理图像与文本信息，具备强大的视觉推理能力。它在数学、科学、图像理解等领域表现优异，支持多模态融合与复杂逻辑推理。模型采用形式化语言和强化学习技术，提升推理准确性与可解释性，适用于科研、教育、医疗及自动驾驶等场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 623 浏览

蜜巢政务大模型

蜜巢为蜜度自主研发的政务大模型，在研发工作中，构建了Token数超1万亿、中文内容占比超75%的高质量语料数据集用于预训练工作。

创作工具 1970年01月01日 0 点赞 0 评论 625 浏览

Gemma 3n

Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型，基于 Gemini Nano 架构，采用逐层嵌入技术，将内存占用压缩至 2-4B 参数模型水平。支持文本、图像、短视频和音频输入，可生成结构化文本输出，并具备音频转录、情感分析等功能。可在本地设备运行，响应时间低至 50 毫秒，适用于语音助手、内容生成和学术任务定制。

AI项目与工具 2025年06月11日 87 点赞 0 评论 625 浏览

MCP万能工具箱

MCP万能工具箱是一个基于MCP开放协议的AI工具集成平台，提供近百款免费工具，覆盖办公、金融、数据处理等场景。支持一键调用多种功能，如财报解析、投资建议、地图导航等，并集成多个主流大模型。用户无需编程即可创建个性化智能体，提升工作效率与决策能力。平台具备安全机制，兼容多系统，适用于办公自动化、金融分析及专业领域支持等多种应用。

AI项目与工具 2025年06月11日 100 点赞 0 评论 625 浏览