开源 - 智狐AI导航

Smart PDFs

Smart PDFs 是一款免费开源的 AI 工具，用于快速提取和总结 PDF 文档的关键信息。它支持学术论文、行业报告和技术文档等多种格式，可在数秒内生成结构清晰的章节式摘要。工具采用 Llama 3.3 模型进行智能处理，并支持图像生成和内容分享功能，适用于学术、职场和个人使用场景。

AI项目与工具 2025年06月11日 61 点赞 0 评论 494 浏览

Shandu

Shandu 是一款基于 LangChain 和 LangGraph 技术的开源 AI 研究自动化工具，支持多引擎搜索、递归探索和智能网页爬取，能自动生成结构化研究报告。用户可通过命令行输入主题并设置参数，快速输出包含引用的 Markdown 格式文档。适用于学术研究、市场分析、技术探索及教育等多个领域，具备高度灵活性和信息处理能力。

AI项目与工具 2025年06月12日 79 点赞 0 评论 493 浏览

Versatile

Versatile-OCR-Program是一款开源多模态OCR工具，支持从教育材料中提取文本、公式、表格等结构化数据，输出为JSON或Markdown格式，准确率高达90%-95%。它基于DocLayout-YOLO、Google Vision和MathPix等技术，支持多语言处理，适用于教育数据集制作、教学辅助、AI模型训练及个人学习等场景。

AI项目与工具 2025年06月11日 77 点赞 0 评论 492 浏览

3D

3D-Speaker是一个多模态开源项目，专注于通过结合声学、语义和视觉信息，实现高精度的说话人识别和语种识别。其主要功能包括说话人日志、说话人识别、语种识别、多模态识别以及重叠说话人检测。项目提供了工业级模型、训练与推理代码，以及多样化数据集，并支持复杂环境下的语音处理任务。应用场景涵盖会议记录、法庭记录、广播制作、电话客服和安全监控等领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 492 浏览

Caesium.app

一款免费的开源在线图像压缩工具，Caesium支持JPG、PNG等格式的批量处理和预览功能。能将照片压缩至原始大小的90%。

图片处理 2025年06月05日 60 点赞 0 评论 491 浏览

NeuraPress

一款专注于微信公众号排版的Markdown编辑器，支持移动端，搭配DeepSeek和微信公众号助手，利用碎片化时间，通过手机就能编辑并发布带有排版效果的公众号文章。

Ai开源项目 2025年06月05日 86 点赞 0 评论 491 浏览

SleepFM

SleepFM是一款由斯坦福大学开发的开源多模态睡眠分析模型，利用脑电图（EEG）、心电图（ECG）和呼吸信号等数据，实现睡眠阶段分类、睡眠呼吸障碍检测及人口统计属性预测等功能。它通过对比学习技术和自监督预训练方法提升分析精度，并支持临床诊断、药物开发、健康管理等多个应用场景，为睡眠医学研究提供重要工具。

AI项目与工具 2025年06月12日 50 点赞 0 评论 490 浏览

n8n

n8n是一款开源的自动化工作流管理系统，采用低代码平台设计，支持拖放式工作流创建，无需编程即可实现复杂业务流程的自动化。其核心功能包括工作流自动化、多应用集成、数据转换与错误处理，同时具备强大的调试和日志记录能力。n8n基于Docker容器化部署，支持事件驱动和数据流处理，广泛应用于数据集成、报告生成、客户支持自动化及社交媒体管理等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 490 浏览

TimesFM 2.0

TimesFM 2.0是谷歌推出的开源时间序列预测模型，采用仅解码器架构，支持处理长达2048个时间点的单变量序列，具备灵活的预测频率选择与分位头预测功能。模型通过大规模自监督预训练，覆盖多个领域，具有优秀的泛化能力。适用于零售、金融、交通、环境监测等多个场景，为数据分析与决策提供支持。

AI项目与工具 2025年06月12日 69 点赞 0 评论 487 浏览

Open-Sora是一个开源视频生成模型，基于DiT架构，通过三个阶段的训练（大规模图像预训练、大规模视频预训练和高质量视频数据微调），生成与文本描述相符的视频内容。该模型包括预训练的VAE、文本编码器和STDiT（Spatial-Temporal Diffusion Transformer）核心组件，利用空间-时间注意力机制和交叉注意力模块实现视频生成。项目旨在提供全面的视频生成模型训练过程，供

AI项目与工具 2024年01月01日 97 点赞 0 评论 485 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期