Infinite Mobility Infinite Mobility是由上海AI Lab开发的交互式物体生成模型,基于程序化技术快速生成高质量、多样化的可交互物体,支持22类常见物体,单次生成仅需1秒,成本低至0.01元。其生成的物体广泛应用于机器人仿真、医疗设备开发、家庭服务机器人等领域,提升虚拟训练的真实性和效率。 AI项目与工具 2025年06月11日 31 点赞 0 评论 141 浏览
OmniManip OmniManip是由北京大学与智元机器人联合实验室开发的通用机器人操作框架,结合视觉语言模型与三维操作技术,实现机器人在非结构化环境中的任务执行。其核心为以对象为中心的交互基元表示法,支持零样本泛化、跨平台部署及大规模仿真数据生成。通过双闭环系统设计与任务分解机制,提升操作精度与适应性,适用于日常操作、工业自动化及服务机器人等场景。 AI项目与工具 2025年06月12日 53 点赞 0 评论 148 浏览
LLM Engineer Toolkit 一个精心整理的LLM工具库,它将120多个与LLM相关的库按照功能和用途进行了细致分类,涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。 Ai学习资源 2025年06月05日 71 点赞 0 评论 170 浏览
Insight Insight-V是一款由南洋理工大学、腾讯和清华大学联合研发的多模态大型语言模型,专为提升长链视觉推理能力而设计。该模型通过多智能体系统将任务分解为推理与总结两步,并采用两阶段训练流程优化性能。其渐进式数据生成和多粒度评估方法进一步提升了模型的推理精度,在多个视觉推理基准测试中表现出色。 AI项目与工具 2025年06月12日 98 点赞 0 评论 213 浏览
HoloPart HoloPart 是一种基于扩散模型的 3D 分割工具,能准确识别并补全被遮挡的语义部件,支持几何与材质编辑等任务。其两阶段方法结合局部与全局注意力机制,提升分割精度与一致性。适用于动画制作、几何优化及数据生成等领域,已在多个数据集上取得优异性能。 AI项目与工具 2025年06月11日 84 点赞 0 评论 273 浏览
Infinity Infinity-MM是智源研究院发布的千万级多模态指令数据集,包含4300万条样本,涵盖视觉问答、文字识别、文档分析及数学推理等多领域任务。它通过严格的筛选和去重保证数据质量,并采用合成数据生成技术扩展数据集规模。基于此数据集,智源研究院训练出了20亿参数的Aquila-VL-2B模型,在多项基准测试中表现出色,推动了多模态AI领域的研究与发展。 AI项目与工具 2025年06月12日 87 点赞 0 评论 299 浏览
Kiln AI Kiln AI 是一款开源 AI 开发工具,支持多平台使用,提供零代码微调、合成数据生成及团队协作功能。内置交互式工具,兼容多种模型和 AI 提供商,支持 Git 版本控制与自动部署,适用于智能客服、医疗、教育、金融等场景,注重数据隐私与安全性。 AI项目与工具 2025年06月12日 59 点赞 0 评论 327 浏览
Kimi提示词专家 Kimi提示词专家是一款面向普通用户的AI工具,专注于帮助其构建高效且精确的提示词。它具备常用语收藏、预设模板以及结构化提示词生成等功能,广泛应用于数据生成、代码编写、情感分析等领域,显著提升了人机交互的质量与效率。 AI项目与工具 2025年06月12日 99 点赞 0 评论 336 浏览
MATRIX MATRIX-Gen是一个基于多智能体模拟技术的系统,通过构建虚拟社会生成高质量训练指令数据,用于提升大型语言模型的表现。该工具支持多种应用场景,如软件开发、商业活动、医疗诊断、教育和客户服务,能够显著提高模型在不同领域的性能,并促进其自我进化。 AI项目与工具 2025年06月12日 73 点赞 0 评论 366 浏览
DAM DAM-3B是英伟达开发的多模态大语言模型,专用于图像和视频中特定区域的详细描述。支持点、边界框、涂鸦或掩码等方式指定目标区域,生成精准文本描述。其核心技术包括焦点提示与局部视觉骨干网络,有效融合全局与局部特征。DAM-3B-Video版本扩展至视频处理,适用于动态场景。模型基于Transformer架构,支持多模态输入,广泛应用于内容创作、智能交互及无障碍工具等领域。 AI项目与工具 2025年06月11日 56 点赞 0 评论 451 浏览