开源项目

GarDiff

GarDiff是一款基于人工智能的虚拟试穿工具,采用CLIP和VAE编码提取服装外观先验,并结合服装聚焦适配器和高频细节增强算法,生成高保真试穿图像。它能够精准对齐服装与人体姿态,保留复杂图案与纹理,适用于电子商务、时尚设计、个性化推荐、社交媒体、虚拟时尚秀及游戏等多个领域,提供真实且沉浸式的在线试穿体验。

Gemini Fullstack LangGraph Quickstart

Gemini Fullstack LangGraph Quickstart 是谷歌DeepMind推出的开源项目,旨在帮助开发者快速搭建基于 Google Gemini 2.5 和 LangGraph 的全栈智能研究助手。项目包含 React 前端和 LangGraph 后端,支持动态生成搜索查询、网络研究、反思推理、迭代优化搜索结果,并生成带有引用的综合答案。支持本地开发和 Docker 部署,

Multiverse

Multiverse是由Enigma Labs开发的全球首个基于AI生成的多人游戏模型,支持实时交互与动态世界生成,确保玩家视角一致。其核心技术包括联合动作向量和双视角通道堆叠,有效解决多人游戏中的同步难题。模型训练成本低,可在普通PC上运行,且项目全面开源,适用于多人游戏开发、VR/AR、AI训练、教育等多个领域。

PicMenu

PicMenu是一款利用AI技术实现菜单可视化的工具,用户可通过上传菜单图片自动生成数字化展示图,支持多格式导出,适用于社交媒体、网站及打印场景。未来版本计划增加菜品详细信息展示,同时具备标签过滤功能,提升用户体验。PicMenu目前为开源项目,基础功能免费提供。

KTransformers

KTransformers是一款由清华大学KVCache.AI团队与趋境科技联合开发的开源工具,用于提升大语言模型的推理性能并降低硬件门槛。它支持在24GB显卡上运行671B参数模型,利用MoE架构和异构计算策略实现高效推理,预处理速度达286 tokens/s,推理速度达14 tokens/s。项目提供灵活的模板框架,兼容多种模型,并通过量化和优化技术减少存储需求,适合个人、企业及研究场景使用。

OpenScholar

OpenScholar是一款由华盛顿大学与艾伦AI研究所联合研发的检索增强型语言模型,专为科学家设计,能够高效检索并综合海量科学文献信息,生成基于文献的事实性回答。该工具具备强大的跨学科适用性,涵盖计算机科学、生物医学等多个领域,同时支持自我反馈迭代优化,显著提升回答质量和引用可靠性。所有相关资源已完全开源,便于全球学者使用与研究。

SoulChat2.0

SoulChat2.0是一款基于大语言模型的心理咨询师数字孪生系统,能够模拟真实心理咨询师的语言风格和技术,提高大模型在实际应用场景中的表现。该模型通过少量真实咨询案例快速构建,支持心理咨询师的工作,并促进心理健康大模型领域的研究发展。其核心功能包括心理咨询师数字孪生建模、低成本高效建模、辅助心理咨询以及开源合作。

PeterCat

PeterCat是一款基于开源技术的智能问答机器人,能够通过自动构建的知识库与GitHub相关功能交互,提供对话式答疑服务。它支持多模型适配、多集成方式,并具备强大的自然语言处理能力和自动化工具支持。主要应用场景涵盖开源项目支持、企业内部论坛、在线教育平台以及客户服务等领域,旨在提升技术交流与问题解决效率。

FoloUp

FoloUp 是一款开源的 AI 语音面试平台,能根据职位描述自动生成面试问题,并通过自然语言交互与候选人进行语音面试。系统支持实时分析、评分与报告生成,提供数据仪表盘用于跟踪候选人表现。平台支持一键分享、远程面试和批量招聘,结合语音识别、NLP 和安全数据管理技术,适用于多种招聘场景,提升招聘效率与质量。