AI项目与工具

ViLAMP

ViLAMP是由蚂蚁集团与中国人民大学联合开发的视觉语言模型，专为高效处理长视频设计。采用混合精度策略，支持在单张A100 GPU上处理长达3小时的视频，提升处理效率并降低计算成本。具备长视频理解、关键信息提取、多任务处理等功能，适用于教育、监控、直播、影视制作及智能客服等场景。技术上通过差分关键帧选择与特征合并优化性能，实现精准且高效的视频分析。

AI项目与工具 2025年06月11日 37 点赞 0 评论 713 浏览

Numerous.ai

Numerous.ai是一款结合ChatGPT技术的AI插件，专为Google Sheets和Excel等电子表格软件设计。它通过自然语言交互简化数据处理与分析，提供数据清理、分类、总结以及智能数据分析等功能，同时支持团队协作和高效运行。Numerous.ai广泛应用于内容创作、数据分析、客户关系管理和人力资源等多个领域，帮助用户提高生产力。

AI项目与工具 2025年06月12日 95 点赞 0 评论 713 浏览

Torch

Torch-MLU 是一个开源的 PyTorch 扩展插件，支持开发者将寒武纪 MLU 系列智能加速卡作为 PyTorch 的加速后端。它实现了对 PyTorch 的原生支持，使开发者能够无缝地将基于 GPU 的深度学习模型迁移到 MLU 硬件上，显著提高模型的训练和推理效率。此外，Torch-MLU 还支持自动混合精度训练，通过优化计算图等技术，进一步提升了模型的执行效率。

AI项目与工具 2025年06月12日 13 点赞 0 评论 712 浏览

VSI

VSI-Bench是一种用于评估多模态大型语言模型（MLLMs）视觉空间智能的基准测试工具，包含超过5000个问题-答案对，覆盖多种真实室内场景视频。其任务类型包括配置型任务、测量估计和时空任务，可全面评估模型的空间认知、理解和记忆能力，并提供标准化的测试集用于模型性能对比。 ---

AI项目与工具 2025年06月12日 10 点赞 0 评论 712 浏览

NVLM

NVLM是NVIDIA研发的多模态大型语言模型，涵盖图像理解、语言理解、跨模态融合、图像描述生成、视觉推理及多模态翻译等功能。它具备多种架构（NVLM-D、NVLM-X、NVLM-H），并采用动态高分辨率输入、1-D平铺标签设计及多模态预训练与微调技术，广泛应用于图像描述、视觉问答、文档理解、多模态搜索及辅助驾驶等领域。

AI项目与工具 2025年06月12日 57 点赞 0 评论 712 浏览