开源

流光卡片

一种将文字、图片、代码等内容包装成精美卡片的文字卡片制作神器,流光卡片可以帮助用户快速生成视觉吸引力强的内容,非常适合用于书摘号、书单号、小红书笔记、名言等。

V-JEPA

创新的自监督学习模型,它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容,还能在图像任务上表现出色,具有广泛的应用潜力。

Diffree

一款通过AI技术可根据文本描述智能地向图像中添加新对象,Diffree让你只需一句话就可以为您的图片添加新元素,不需要复杂的操作就可以体验简单高效的图像编辑工具。

xGen

xGen-MM是一款由Salesforce开发的开源多模态AI模型,具备处理文本和图像等数据类型的能力。该模型通过学习大量图像和文字信息,在视觉语言任务中表现出色,并通过开源模型、数据集和微调代码库促进模型性能的提升。xGen-MM具有多模态理解、大规模数据学习、高性能生成、开源可访问和微调能力等特点。其应用场景广泛,包括图像描述生成、视觉问答、文档理解、内容创作和信息检索等。

Vanna

Vanna 是一款开源的 Python RAG 框架,能够基于大型语言模型生成精确的 SQL 查询。它支持多类型数据库与 LLMs,采用检索增强生成技术提高查询准确性,同时保障数据安全。Vanna 还具备自定义前端界面和用户反馈机制,广泛适用于数据分析师、BI 工具、客户支持系统及数据科学项目等领域。

Stablecog

Stablecog 是一款基于人工智能技术的开源图像生成工具,能够根据文本描述或现有图片生成逼真的艺术作品。它支持多种艺术风格,具备图像编辑和调整功能,适用于艺术创作、设计、社交媒体内容制作等多个领域。

OpenDeepSearch

OpenDeepSearch 是一款开源深度搜索工具,结合语义重排与多源信息整合技术,提升搜索精度与覆盖范围。支持与 Hugging Face SmolAgents 无缝集成,具备语义搜索、多模式处理及可扩展性强等特点,适用于复杂问题解答、实时信息检索及学术研究等场景。

Magic Animate

Magic Animate是一项开创性的开源项目,简化了动画创作,允许您从单个图像和动态视频制作动画视频。

Devika

Devika是一款开源的AI编程工具,支持自然语言指令解析、复杂任务分解以及跨平台代码生成。凭借其先进的AI搜索与推理能力,Devika能够协助开发者高效完成从概念到实现的全过程,涵盖新功能开发、代码重构、Bug修复及自动化测试等多个应用场景。同时,其模块化架构便于扩展,确保了在不同项目中的灵活性与实用性。

VideoRAG

VideoRAG是一种基于检索增强生成(RAG)技术的工具,旨在提升长视频的理解能力。它通过提取视频中的多模态信息(如OCR、ASR和对象检测),并将其与视频帧和用户查询结合,增强大型视频语言模型的处理效果。该技术轻量高效,易于集成,适用于视频问答、内容分析、教育、媒体创作及企业知识管理等多个领域。