开源

ViLAMP

ViLAMP是由蚂蚁集团与中国人民大学联合开发的视觉语言模型,专为高效处理长视频设计。采用混合精度策略,支持在单张A100 GPU上处理长达3小时的视频,提升处理效率并降低计算成本。具备长视频理解、关键信息提取、多任务处理等功能,适用于教育、监控、直播、影视制作及智能客服等场景。技术上通过差分关键帧选择与特征合并优化性能,实现精准且高效的视频分析。

AutoGen

微软开发的一个开源框架,用于构建和管理基于LLM的多代理系统。它允许用户创建多个Agent,这些代理可以通过对话协作完成复杂的任务。

FancyVideo

FancyVideo是一款由360公司与中山大学合作开发的AI文生视频模型,采用创新的跨帧文本引导模块(CTGM)。它能够根据文本描述生成连贯且动态丰富的视频内容,支持高分辨率视频输出,并保持时间上的连贯性。作为开源项目,FancyVideo提供了详尽的文档和代码库,便于研究者和开发者深入研究和应用。主要功能包括文本到视频生成、跨帧文本引导、时间信息注入及时间亲和度细化等。

Molmo 72B

Molmo 72B是一款由艾伦人工智能研究所推出的开源多模态AI模型,集成了图像和文本处理能力,适用于图像描述生成、视觉问答、文档解析及多模态交互等多种任务。凭借其强大的视觉编码能力和先进的模型架构,Molmo 72B在学术基准测试中表现优异,为开源AI技术的发展做出了重要贡献。

LowCodeEngine

LowCodeEngine是一款由阿里巴巴开源的低代码开发框架,专注于通过拖拽和配置简化复杂系统的构建过程。其核心功能包括组件化开发、数据绑定、模板引擎及物料体系支持,同时具备强大的扩展能力和基于TypeScript的开发环境。该工具适用于企业内部系统、业务流程自动化、数据可视化、电子商务平台及移动应用开发等多个场景,致力于提升开发效率和质量。

FlowGPT

FlowGPT是一个针对ChatGPT的高质量问题模板大全,专门为小白用户汇集了ChatGPT的各种Prompt清单,可以认为是向ChatGPT提问的模板,小白用户可以直接抄作业。它旨在通过提供各种模...

WaifuXL

一款专注于动漫风格图像和GIF的AI图像放大工具,能够将图像和 GIF 的分辨率提高多达16倍,同时保留原始风格和细节。

麦吉

麦吉(Magic)是一款开源的一站式AI生产力平台,支持企业快速构建和部署AI应用。平台采用Apache-2.0协议,具备高度灵活性和可扩展性。用户无需编程基础,即可通过可视化界面创建AI助手,支持拖拽式工作流设计、多交互方式及长期记忆功能。适用于企业内部沟通、业务流程自动化、创意创作等场景,支持跨平台部署与API/SDK发布,提升工作效率与协作能力。

BlenderMCP

BlenderMCP 是一款将 Blender 与 Claude AI 集成的工具,通过 socket 服务器实现双向通信,支持 3D 对象操作、材质控制、场景信息获取及 Python 代码执行。用户可通过自然语言指令高效完成建模任务,提升创作效率。工具由插件和服务器组成,采用 JSON 协议进行数据交互,适用于快速建模、场景优化及教育辅助等场景。

PromptBench

一个基于 Pytorch 的 Python 包,用于评估和理解大型语言模型的统一库。它为研究人员提供了用户友好的 API,以便对 LLM 进行评估。