开源

OBS Studio

一款免费开源的视频录制及直播串流软件,用户可以通过OBS Studio创建包含多种视频源的场景,进行视频捕捉、合成、编码和录制,支持Windows、macOS、Linux和BSD等多个平台。

AIMv2

AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型,通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练,支持多种参数规模,适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能,并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异,具备良好的可扩展性和零样本适应能力。

FastGPT

FastGPT是一款开源的AI知识库构建平台,支持多种文档格式导入和自动预处理,提供可视化工作流设计、多模型兼容及API集成功能。用户可快速构建智能问答系统和自动化流程,适用于客服、知识管理、教育、医疗和旅游等多个场景。平台提供不同版本的定价方案,满足个人、团队及企业的需求。

爱作画

爱作画是一个专业的AI绘画图片创作平台,可以让用户通过Stable Diffusion、NovelAI、Midjourney生成各种风格的图片。

Soundwave

Soundwave是由香港中文大学(深圳)开发的开源语音理解大模型,专注于语音与文本的智能对齐与处理。它采用对齐适配器和压缩适配器技术,提升语音特征压缩效率,支持语音翻译、语音问答、情绪识别及多模态交互等功能。适用于智能语音助手、语言学习、内容创作等多个领域,具有广泛的应用前景。

Coco AI

INFINI Labs 开发的一款开源、跨平台的统一AI搜索工具。它能够连接并搜索多种数据源,包括本地应用程序、文件以及云端平台如 Google Drive、Notion、语雀和 Hugo 等。

BiliNote

BiliNote 是一款开源 AI 视频笔记工具,支持从多个平台导入视频链接并生成结构化的 Markdown 笔记。具备音频转写、大模型总结、截图插入、内容跳转链接等功能,适用于学习、创作、培训等场景。采用 FastAPI 和 React 技术栈,支持 Docker 部署,便于用户快速集成与使用。

Darwin模型

Darwin模型是一个专门为自然科学领域(尤其是物理、化学和材料科学)设计的大语言模型(LLM),只要通过整合结构化和非结构化的科学知识,提升语言模型在科学研究

Deepfake Defenders

Deepfake Defenders 是一个由中国科学院自动化研究所的 VisionRush 团队开发的开源 AI 模型,主要用于检测和防御 Deepfake 技术生成的伪造图像和视频。它通过分析媒体内容中的细微像素变化来识别伪造内容,并提供像素级分析、实时检测等功能。该模型采用卷积神经网络(CNN)、生成对抗网络(GAN)等技术,支持多模态分析,具备开源协作特性,广泛应用于社交媒体监控、新闻验证

Nanobrowser

Nanobrowser 是一款开源的 Chrome 扩展工具,采用多智能体系统实现网页自动化任务,如信息提取和操作执行。用户可通过 LLM API 配置不同智能体,提升任务灵活性。支持本地运行,保障隐私安全,适用于信息收集、电商、内容创作、企业自动化和个人效率提升等多种场景。其动态调整机制增强了任务的稳定性和适应能力。