开源 - 智狐AI导航

START

START是由阿里巴巴集团与中科大联合研发的工具增强型推理模型，通过集成外部工具（如Python代码执行器）提升大型语言模型的推理能力。其核心在于“Hint-infer”和“Hint-RFT”技术，结合长链推理与工具调用，显著提高复杂数学、科学问题及编程任务的准确性和效率。该模型具备自我调试、多策略探索和自学习能力，适用于科研、教育、编程等多个领域，是首个开源的长链推理与工具集成模型。

AI项目与工具 2025年06月12日 72 点赞 0 评论 814 浏览

Oliva

Oliva 是一款基于语音驱动的 RAG 助手，结合 Langchain 和 Qdrant 向量数据库，实现语音指令到结构化数据的实时响应。支持多智能体协作、语义搜索与灵活知识库集成，适用于企业知识库、智能客服、智能家居等多种场景。具备语音识别、实时通信和自然语言处理能力，提升信息获取与交互效率。

AI项目与工具 2025年06月12日 57 点赞 0 评论 815 浏览

FaceSwap

FaceSwap是一款开源AI换脸软件，利用深度学习技术实现人脸检测、提取及替换。它支持跨平台操作，包括Windows、macOS和Linux，并可借助GPU加速提升处理效率。FaceSwap还允许用户自定义模型训练以优化换脸效果，广泛应用于影视制作、教育、游戏开发以及虚拟现实等领域。

AI项目与工具 2025年06月12日 45 点赞 0 评论 816 浏览

DeepSeek V3

DeepSeek V3是一款由幻方量化旗下的深度求索公司开源的AI模型，拥有6850亿参数，采用混合专家架构。它在多语言编程、长文本处理和对话交互方面表现出色，能够生成高质量代码、优化现有代码、协助调试、生成文本、分析文本、润色文本，并支持自然对话和多轮对话。此外，它在多个基准测试中表现出色，包括编程、数学、推理等领域。

AI项目与工具 2025年06月12日 53 点赞 0 评论 819 浏览

MiniCPM 4.0

MiniCPM 4.0是面壁智能推出的高效端侧大模型，包含8B和0.5B两种参数规模。其采用创新稀疏架构和三值量化技术，实现模型体积缩小90%并保持高性能。自研CPM.cu推理框架在极限场景下可提升220倍速度，支持多种开源框架部署，并适配主流芯片。具备高效双频换挡机制、多平台适配和多种版本选择，适用于智能辅导、医疗辅助、客服、游戏剧情生成等场景。

AI项目与工具 2025年06月11日 59 点赞 0 评论 819 浏览

FramePack

FramePack 是斯坦福大学推出的开源 AI 视频生成模型，通过帧上下文打包和抗漂移采样技术，实现高效、稳定的视频生成。其仅需 6GB 显存即可运行，支持实时高清视频生成，具备灵活的调度策略，适用于多种应用场景，如短视频制作、游戏开发、教育与广告等，显著降低了视频生成的硬件门槛。

AI项目与工具 2025年06月11日 23 点赞 0 评论 819 浏览

Whisper

Whisper是一个开源的自动语音识别系统，经过68万小时的多语言和多任务监督数据训练

Ai语音工具 1970年01月01日 0 点赞 0 评论 820 浏览

NotebookMLX

NotebookMLX 是一款基于 MLX 技术开发的开源工具，支持将 PDF 文档转换为音频播客。它通过 PDF 预处理、播客脚本生成、文本优化以及文本转语音等功能，实现了从 PDF 文件到高质量音频内容的全流程自动化处理，适用于教育、播客创作、有声书制作等多个领域，显著提升了信息传播效率和用户体验。

AI项目与工具 2025年06月12日 70 点赞 0 评论 820 浏览

Zero123

一种从单个图像到一致的多视图扩散基础模型，旨在使用单视图输入生成 3D 一致的多视图图像。

Ai开源项目 2025年06月05日 19 点赞 0 评论 822 浏览

LobeChat

一个开源、高性能的聊天机器人框架，支持语音合成、多模态和可扩展（函数调用）插件系统。支持一键免费部署您的私人 ChatGPT/LLM Web 应用程序。

AI写作对话 2025年06月05日 37 点赞 0 评论 823 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期