开源 - 智狐AI导航

PDF2Audio

PDF2Audio 是一款开源工具，支持将 PDF 文档转换为音频内容，适用于播客制作、教育、业务演示等多个场景。其核心功能包括 PDF 转文本、生成播客脚本、文本转语音转换、多语言支持及高级编辑功能。用户可通过自定义选项调整文本生成模型、语音风格等，支持批量处理和多种模板适配，方便用户根据需求生成高质量音频。

AI项目与工具 2025年06月12日 35 点赞 0 评论 783 浏览

ANTO

ANTO是一款开源的Windows桌面字幕翻译工具，专注于SRT格式字幕文件的翻译。它集成了多种翻译引擎，支持批量处理和预览功能，帮助用户高效翻译字幕文件。凭借开源特性和社区支持，ANTO不断优化并扩展功能，适用于视频搬运、字幕制作、外语学习等多个场景。

AI项目与工具 2025年06月12日 42 点赞 0 评论 570 浏览

Qwen2.5

Qwen2.5-Coder是一款开源代码生成模型，覆盖多种规模参数，支持超过40种编程语言，擅长代码生成、推理、修复及多语言支持。其旗舰模型在多项基准测试中表现优异，具备强大的长上下文处理能力和人类偏好对齐特性。适用于日常编程、代码学习、教育、代码审查及自动化测试等场景。

AI项目与工具 2025年06月12日 87 点赞 0 评论 926 浏览

E2B

E2B 是一款面向 AI 开发者的工具平台，专注于构建自动化云环境，支持多种大型语言模型和 AI 框架。它提供代码解释与执行、沙箱环境、多代理支持等功能，旨在助力开发者高效构建生产级 AI 应用程序，涵盖代码生成、推理和数据分析等领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 724 浏览

Nemotron

Nemotron-Mini-4B-Instruct是一款由英伟达开发的小型开源语言模型，针对角色扮演、检索增强生成（RAG）及函数调用任务进行了优化。模型基于Transformer架构，利用蒸馏、剪枝和量化技术提升运行效率与设备端适配能力，适用于实时交互场景，如游戏NPC对话或虚拟助手交互。其快速响应特性使其在客户服务、教育软件及内容创作领域也展现出巨大潜力。

AI项目与工具 2025年06月12日 46 点赞 0 评论 724 浏览

FaceSwap

FaceSwap是一款开源AI换脸软件，利用深度学习技术实现人脸检测、提取及替换。它支持跨平台操作，包括Windows、macOS和Linux，并可借助GPU加速提升处理效率。FaceSwap还允许用户自定义模型训练以优化换脸效果，广泛应用于影视制作、教育、游戏开发以及虚拟现实等领域。

AI项目与工具 2025年06月12日 45 点赞 0 评论 816 浏览

PhotoPrism

PhotoPrism是一款开源的AI照片管理工具，采用Go语言开发，支持用户在本地服务器上运行，确保数据隐私与安全性。它通过AI技术实现照片的智能分类与搜索，涵盖人物、物体和场景识别，还支持RAW、JPG等多种文件格式，提供面部识别、地理标签及WebDAV同步等功能，适用于个人、家庭、企业和教育机构等多样化需求。

AI项目与工具 2025年06月12日 59 点赞 0 评论 452 浏览

书生·筑梦2.0（Vchitect 2.0）

书生·筑梦2.0是一款由上海人工智能实验室开发的开源视频生成大模型，支持文本到视频和图像到视频的转换，生成高质量的2K分辨率视频内容。它具备灵活的宽高比选择、强大的超分辨率处理能力以及创新的视频评测框架，适用于广告、教育、影视等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 525 浏览

QA

QA-MDT是一款基于文本生成高质量音乐的开源工具，其核心技术包括质量感知训练、掩蔽扩散变换器以及音乐与文本的同步优化。它能够根据用户提供的文本描述生成多样化的音乐作品，并通过质量控制确保输出结果的高保真度。此外，QA-MDT支持音乐与文本的一致性增强，适用于广告、影视配乐、音乐教育及智能设备等多个领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 738 浏览

SleepFM

SleepFM是一款由斯坦福大学开发的开源多模态睡眠分析模型，利用脑电图（EEG）、心电图（ECG）和呼吸信号等数据，实现睡眠阶段分类、睡眠呼吸障碍检测及人口统计属性预测等功能。它通过对比学习技术和自监督预训练方法提升分析精度，并支持临床诊断、药物开发、健康管理等多个应用场景，为睡眠医学研究提供重要工具。

AI项目与工具 2025年06月12日 50 点赞 0 评论 490 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期