开源

ComfyFlow

ComfyFlow 是一个强大的应用程序创建和分享平台,它通过提供全托管服务和用户友好的界面,简化了从设计到分享的整个流程。

NotesGPT

NotesGPT是一款开源的AI语音笔记工具,具备语音转录、自动总结及任务生成等功能,采用先进技术保障转录准确性与任务生成效率,支持多语言并适配多种使用场景,如会议记录、学术研究及个人备忘等。

MiniPerplx

MiniPerplx 是一款基于 Grok 2.0 模型的开源 AI 搜索工具,支持网页、视频、学术论文等内容的检索。它提供代码解释、天气查询、URL 摘要、位置搜索等多功能服务,采用 Next.js 和 Vercel AI SDK 构建,具备良好的用户体验。用户可访问 GitHub 自行部署,适用于学术研究、编程开发、新闻获取等多个场景。

流畅阅读

FluentRead 是一款开源的浏览器翻译插件,基于AI技术提供精准、自然的翻译服务。支持多种翻译引擎和双语对照显示,具备隐私保护和高度定制化功能。适用于学术研究、工作场景、语言学习及日常阅读,兼容主流浏览器,保障用户数据安全。其开源特性增强了透明度与灵活性,满足多样化翻译需求。

SoraWebui

一个开源项目,允许用户使用 OpenAI Sora 模型使用文本在线生成视频,从而简化视频创建,并具有轻松的一键网站部署功能。

OpenMemory MCP

OpenMemory MCP 是一款基于开放模型上下文协议(MCP)的开源工具,支持 AI 工具间共享上下文信息,提升交互效率。具备本地化存储、统一管理界面、标准化 API 及多平台兼容性,适用于软件开发、项目管理等场景。数据全程本地处理,确保隐私与安全,采用 Docker 部署并结合零知识证明技术增强安全性。</p>

BISHENG毕昇大模型

一款基于 Apache 2.0 License 协议正式开源的领先开源大模型应用开发平台,能搭建分析报告生成、知识库问答、对话、要素提取等多种大模型应用。

OpenEMMA

OpenEMMA是一个开源的端到端自动驾驶多模态模型框架,基于预训练的多模态大型语言模型(MLLMs),能够处理视觉数据和复杂驾驶场景的推理任务。它通过链式思维推理机制提升轨迹规划和感知任务性能,并集成了优化的YOLO模型以提高3D边界框预测的准确性。此外,OpenEMMA支持人类可读的输出,适用于多种驾驶环境,包括城市道路、高速公路、夜间及复杂天气条件下的驾驶。

OpenUtau

OpenUtau 是一款开源的歌声合成工具,支持 UTAU 音源库和 VSQX 格式,具备音素编辑、颤音控制、多语言界面等功能,适用于音乐创作与虚拟歌手合成。它兼容 Windows、macOS 和 Linux,提供预渲染与实时预览,提升创作效率,适合音乐人、开发者及音频爱好者使用。

快手可图

快手可图大模型(Kolors)是快手公司自主研发的一款AI图像生成工具。支持文生图和图生图两大功能并提供了20多种AI图像玩法,Kolors可用于AI创作图像以及AI形象定制。