开源

量子位

量子位,一家专注于人工智能与前沿科技领域的产业服务平台,追踪人工智能新趋势,报道科技行业新突破。

VLM

VLM-R1 是由 Om AI Lab 开发的视觉语言模型,基于 Qwen2.5-VL 架构,结合强化学习优化技术,具备精准的指代表达理解和多模态处理能力。该模型适用于复杂场景下的视觉分析,支持自然语言指令定位图像目标,并在跨域数据中表现出良好的泛化能力。其应用场景涵盖智能交互、无障碍辅助、自动驾驶、医疗影像分析等多个领域。

Jules

Jules 是 Google Labs 推出的 AI 编程智能体,通过自动化技术提升开发效率。它能根据任务描述自动生成代码,将复杂任务分解为多个步骤,并理解代码库、定位关键模块、自动运行单元测试。Jules 可根据开发者反馈调整方案,支持 GitHub 集成,适用于软件开发、敏捷团队协作、开源项目贡献及企业级应用开发等场景。

FastAPI

FastAPI-MCP 是一款将 FastAPI 端点自动转换为 MCP 协议的开源工具,支持零配置部署,保留原有接口结构和文档,具备灵活的部署方式和自定义命名功能。适用于企业自动化、AI 应用开发、数据分析等多个场景,提升 AI 与后端服务的交互效率。

GenAI_Agents

一个专注于生成式AI Agents技术的开源项目,GenAI_Agents提供从基础到高级的教程与实现代码,帮助开发者学习并构建智能、交互式的AI系统。

Pollinations AI

Pollinations 是一个通过AI生成媒体内容的平台。平台可能提供多种类型的模板和工具,支持文本、图像、音频、视频等多媒体格式的创作。

悟道大模型

北京智源研究院开发的一系列超大规模智能模型系统,悟道大模型旨在在语言处理领域达到或超越国际先进水平。

DeepFaceLive

DeepFaceLive是一款基于人工智能的面部合成技术,它可以将一个人的面部表情和动作合成到另一个人的脸上,从而实现非常逼真的面部合成效果。

StyleShot

StyleShot 是一个开源的AI图像风格迁移模型,能够实现文本和图像驱动的风格迁移。它利用风格感知编码器和内容融合编码器,捕捉和再现风格细节,生成高质量的风格化图像。主要应用场景包括艺术创作、社交媒体、游戏开发和电影视频制作。