开源

Archon

Archon 是一个开源 AI 智能体构建与优化平台,支持多智能体协作、领域知识集成、本地 LLM 集成等功能。它提供自动化代码生成、语义搜索、Streamlit 界面交互及 Docker 部署能力,适用于企业、教育、智能家居等多个场景。技术上融合 Pydantic AI 和 LangGraph,强调框架无关性和高效开发流程。

MoshiVis

MoshiVis是一款由Kyutai开发的开源多模态语音模型,支持图像与语音的自然交互。它基于Moshi 7B架构,集成了视觉编码器和跨注意力机制,实现低延迟、自然流畅的对话体验。支持多种后端部署,适用于无障碍应用、智能家居、教育及工业场景,提升人机交互的智能化水平。

OpenShot

一款免费、开源的视频编辑软件,OpenShot提供丰富的视频效果、标题和音轨功能,用户可以轻松创建和编辑高质量的视频。

Flex.2

Flex.2-preview是Ostris开发的开源文本到图像生成模型,具备80亿参数规模。支持长文本输入、图像修复和多模态控制输入,适用于创意设计、图像修复和内容生成等多种场景。模型基于扩散框架,采用多通道输入处理和高效推理算法,可通过ComfyUI或Diffusers库集成使用,适合实验性开发和个性化定制。

SFR-RAG

先进的大型语言模型,它通过强化对上下文的理解,提高了机器在生成文本方面的准确性和可靠性。无论是在客户服务、知识问答、内容创作还是专业咨询领域,SFR-RAG都能提供高质量的文...

Genmoai

Genmoai-smol 是一款专为单 GPU 设备设计的开源视频生成模型,能够将文本描述转化为高质量视频内容。其核心优势在于高保真度运动表现、强大的文本提示遵循能力及显存优化技术,支持用户在资源受限条件下开展视频创作。该工具提供了 Gradio UI 和命令行界面两种操作方式,并广泛应用于视频内容创作、超现实效果视频制作和技术研究等领域。

tldraw

tldraw是一款开源的无限画布工具,支持多人实时协作,适用于团队设计、项目管理和教育等领域。它提供了手绘风格、智能箭头、捕捉和便签等功能,以及丰富的绘图工具如画笔、橡皮擦、线框和文本工具,用户可在无限画布上自由创作,不受空间限制。

Refly Ai

一款基于自由画布构建的AI原生内容创作平台,通过多线程对话、知识库整合、上下文记忆、智能搜索和AI文档编辑器等功能,轻松将想法转化为优质内容。

QwQ

QwQ-32B-Preview是一款由阿里巴巴开发的开源AI推理模型,具有325亿参数,擅长处理数学与编程领域的复杂任务。它能在多个基准测试中超越同类产品,并提供透明化的推理流程。然而,该模型在语言切换及跨领域应用上存在一定局限性。

MinerU

MinerU是一款开源智能数据提取工具,专注于复杂PDF文档的高效解析与提取。它能够将包含多种内容类型的PDF文档转换为结构化的Markdown格式,支持图像、公式、表格和文本等多种内容处理,保留原始文档结构和格式,支持公式识别与转换成LaTeX格式,自动删除页眉、页脚、脚注和页码等非内容元素,适用于学术、财务、法律等多个领域。