ModelEngine ModelEngine 是华为开源的全流程 AI 开发工具链,涵盖数据处理、模型训练与应用开发三大核心模块。支持多模态数据清洗、知识向量化及模型推理,提供低代码编排和 RAG 框架,适用于医疗、金融、制造等领域的 AI 应用开发与行业化落地。 AI项目与工具 2025年06月12日 75 点赞 0 评论 299 浏览
DrivingDojo DrivingDojo是一个由中国科学院自动化研究所与美团无人车团队合作研发的数据集,包含18,000个视频片段,涵盖全面的驾驶操作、多智能体交互及开放世界驾驶知识。它定义了动作指令跟随(AIF)基准,用于评估世界模型的预测能力,并支持自动驾驶算法开发、世界模型训练、多智能体交互模拟及罕见事件处理等多个应用场景。 AI项目与工具 2025年06月12日 85 点赞 0 评论 299 浏览
通义点金 通义点金,大模型驱动的智能金融助手,深度解读财报研报,轻松分析金融事件,自动绘制图表表格,实时市场数据分析,助力用户对话金融世界。 Ai办公效率 2025年06月05日 51 点赞 0 评论 298 浏览
Eagle 2.5 Eagle 2.5 是一款由英伟达开发的视觉语言模型,专注于长上下文多模态学习,具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B,但性能接近更大模型。采用信息优先采样和渐进式后训练策略,提升模型稳定性与适应性。支持多样任务,适用于视频分析、图像处理、内容创作及教育等多个领域。 AI项目与工具 2025年06月11日 59 点赞 0 评论 297 浏览
LongLLaVA LongLLaVA是由香港中文大学(深圳)研究团队开发的多模态大型语言模型,结合Mamba和Transformer模块,利用2D池化技术压缩图像token,大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异,特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化,支持多种多模态输入处理,广泛应用于视频分析、医学影像诊断、环境监测等领域。 AI项目与工具 2025年06月12日 67 点赞 0 评论 297 浏览
GenXD GenXD是一款由新加坡国立大学与微软联合开发的3D-4D联合生成框架,能够从任意数量的条件图像生成高质量的3D和4D场景。它通过数据整理流程提取相机姿态和物体运动信息,基于多视角时序模块分离相机与物体运动,并借助掩码潜在条件支持多种视角生成。GenXD支持3D场景重建、动态场景生成以及3D和4D数据融合,适用于视频游戏开发、电影制作、虚拟现实、建筑规划等多个领域。 AI项目与工具 2025年06月12日 54 点赞 0 评论 297 浏览