开源

Open Deep Research

Open Deep Research 是一个开源 AI 智能体,支持多语言模型和 Firecrawl 数据提取,用于执行复杂的研究任务。它提供统一 API 和 Next.js 框架,具备实时数据处理、结构化信息提取及多维度分析能力,适用于文献综述、行业分析、投资研究等场景。

Oneimg

文字转图片应用,无需拖拽排版,直接输入内容,一键导出长图。

Open Avatar Chat

Open Avatar Chat是阿里开源的模块化实时数字人对话系统,支持低延迟交互与多模态输入输出。系统采用模块化架构,允许灵活配置语音识别、语言模型和语音合成等组件,兼容本地与云服务。支持2D/3D数字人渲染,适用于客户服务、教育、娱乐及企业应用等多个场景,为开发者提供高效、灵活的AI对话解决方案。

AIMv2

AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型,通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练,支持多种参数规模,适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能,并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异,具备良好的可扩展性和零样本适应能力。

BiliNote

BiliNote 是一款开源 AI 视频笔记工具,支持从多个平台导入视频链接并生成结构化的 Markdown 笔记。具备音频转写、大模型总结、截图插入、内容跳转链接等功能,适用于学习、创作、培训等场景。采用 FastAPI 和 React 技术栈,支持 Docker 部署,便于用户快速集成与使用。

MultiPost

可辅助你通过自动化的方式规划自媒体的内容发布,一键将内容发布到多个平台,开源免费。

Nanobrowser

Nanobrowser 是一款开源的 Chrome 扩展工具,采用多智能体系统实现网页自动化任务,如信息提取和操作执行。用户可通过 LLM API 配置不同智能体,提升任务灵活性。支持本地运行,保障隐私安全,适用于信息收集、电商、内容创作、企业自动化和个人效率提升等多种场景。其动态调整机制增强了任务的稳定性和适应能力。

Stable Diffusion 3.5

Stable Diffusion 3.5是一套由Stability AI开发的先进AI图像生成模型,包含多个版本以适应不同需求。它具备高定制性、高效的消费级硬件运行能力和开源许可,能够生成高质量、多样化的图像,支持多种风格和肤色表现。其核心技术基于多模态学习和优化的架构,适用于艺术创作、游戏开发、广告设计等多个领域。 ---

OBS Studio

一款免费开源的视频录制及直播串流软件,用户可以通过OBS Studio创建包含多种视频源的场景,进行视频捕捉、合成、编码和录制,支持Windows、macOS、Linux和BSD等多个平台。

Darwin模型

Darwin模型是一个专门为自然科学领域(尤其是物理、化学和材料科学)设计的大语言模型(LLM),只要通过整合结构化和非结构化的科学知识,提升语言模型在科学研究