开源

Zerox

Zerox是一款基于GPT-4o-mini模型的开源OCR工具,支持多种文件格式,具备零样本识别能力,可高效处理扫描文档和复杂布局内容。其输出为Markdown格式,便于编辑与使用,同时提供API接口,适用于企业文档管理、学术研究、法律金融等多个场景,显著提升文档处理效率和准确性。

Open Notebook

Open Notebook是一款开源、注重隐私的笔记管理工具,支持多笔记本和多AI模型(如Open AI、Anthropic)。它具备播客生成器、内容集成、AI驱动笔记、集成搜索等核心功能,适用于学术研究、教育、企业知识管理和个人知识整理等多个场景,通过自然语言处理和搜索技术提升信息处理效率。

DataRoom

一个高度集成的、开源的大屏设计与数据可视化工具,基于SpringBoot、MyBatisPlus、Vue、ElementUI、G2Plot和Echarts等技术栈构建。

MedGemma

MedGemma是谷歌推出的开源AI模型,专注于医疗图像与文本分析。它包含4B参数的多模态模型和27B参数的纯文本模型。4B模型擅长解读医疗图像并生成诊断报告,27B模型则用于医疗文本理解与临床推理。支持本地运行或通过Google Cloud部署,适用于医疗诊断、患者分诊、临床决策辅助等场景,提升医疗服务效率与准确性。

Shandu

Shandu 是一款基于 LangChain 和 LangGraph 技术的开源 AI 研究自动化工具,支持多引擎搜索、递归探索和智能网页爬取,能自动生成结构化研究报告。用户可通过命令行输入主题并设置参数,快速输出包含引用的 Markdown 格式文档。适用于学术研究、市场分析、技术探索及教育等多个领域,具备高度灵活性和信息处理能力。

TimesFM 2.0

TimesFM 2.0是谷歌推出的开源时间序列预测模型,采用仅解码器架构,支持处理长达2048个时间点的单变量序列,具备灵活的预测频率选择与分位头预测功能。模型通过大规模自监督预训练,覆盖多个领域,具有优秀的泛化能力。适用于零售、金融、交通、环境监测等多个场景,为数据分析与决策提供支持。

LangGraph WhatsApp Agent

LangGraph WhatsApp Agent 是一个开源 AI 工具,用于在 WhatsApp 上构建智能代理。支持多代理架构、多模态交互及持久化对话状态,集成多种语言模型,提供安全可靠的通信环境。适用于客户服务、信息推送、教育辅导等多个场景,便于开发者快速构建和部署高效的 WhatsApp 机器人。

Dream

Dream-7B是由香港大学与华为诺亚方舟实验室联合开发的开源扩散模型,支持文本、数学和代码生成,具备双向上下文建模能力和灵活的生成控制。其在通用任务、数学推理和编程方面表现优异,适用于文本创作、数学求解、编程辅助及复杂任务规划等多种场景,提供高效且高质量的生成服务。

书生·筑梦2.0(Vchitect 2.0)

书生·筑梦2.0是一款由上海人工智能实验室开发的开源视频生成大模型,支持文本到视频和图像到视频的转换,生成高质量的2K分辨率视频内容。它具备灵活的宽高比选择、强大的超分辨率处理能力以及创新的视频评测框架,适用于广告、教育、影视等多个领域。

ACI.dev

ACI.dev 是一个开源 AI 基础设施平台,支持 600 多种预构建工具集成,涵盖主流应用如 Gmail、Slack 和 Notion。提供灵活的函数调用和 MCP 服务器访问方式,具备多租户认证、动态工具发现及自然语言权限管理功能。平台兼容多种 LLM 框架,支持多语言开发,具备监控与日志功能,适用于智能体开发与部署。