开源

PDFtoChat

PDFtoChat 是一款基于 AI 技术的开源工具,支持用户通过自然语言对话与 PDF 文件交互。它具备强大的文档解析、智能检索和即时反馈能力,广泛应用于学术研究、法律咨询、商业分析、教育培训和技术文档查询等领域,显著提升文档处理效率。

Caesium.app

一款免费的开源在线图像压缩工具,Caesium支持JPG、PNG等格式的批量处理和预览功能。能将照片压缩至原始大小的90%。

Anime gf

一个本地且开源的CharacterAI替代工具,提供了一个用户友好的界面,允许用户在桌面上与虚拟角色互动。你可以自定义创建各种角色,让每个虚拟角色都有自己的独特个性和语言风格。

GPTsApp.io

第三方GPTs商店,由 GPT-4 Turbo 和 Pinecone 提供支持,收录了超过60万的公共GPTs, 为用户提供GPTs排名,收藏, 评测等功能。

SleepFM

SleepFM是一款由斯坦福大学开发的开源多模态睡眠分析模型,利用脑电图(EEG)、心电图(ECG)和呼吸信号等数据,实现睡眠阶段分类、睡眠呼吸障碍检测及人口统计属性预测等功能。它通过对比学习技术和自监督预训练方法提升分析精度,并支持临床诊断、药物开发、健康管理等多个应用场景,为睡眠医学研究提供重要工具。

DeepSeek Artifacts

DeepSeek Artifacts是一款基于AI的前端开发工具,能够自动生成React和Tailwind CSS代码,同时支持构建开放的前端代码数据集。它提供沙盒环境、项目导出以及快速部署等功能,适用于快速原型开发、教育场景及SEO优化等多种用途,旨在提升前端开发效率。

OpenBMB

OpenBMB作为一个大型的中英文双语基础模型,通过在大规模语料库上的预训练,具备了优秀的语言处理能力。

Vanna

Vanna 是一款开源的 Python RAG 框架,能够基于大型语言模型生成精确的 SQL 查询。它支持多类型数据库与 LLMs,采用检索增强生成技术提高查询准确性,同时保障数据安全。Vanna 还具备自定义前端界面和用户反馈机制,广泛适用于数据分析师、BI 工具、客户支持系统及数据科学项目等领域。

Muyan

Muyan-TTS是一款面向播客场景的开源文本转语音工具,基于超10万小时播客数据训练,支持零样本语音合成与说话人适配,可在0.33秒内生成1秒音频,适合实时与长内容合成。支持本地部署与API调用,应用于播客、有声书、视频配音、AI角色及新闻播报等领域,兼具高效性与灵活性。

VideoRAG

VideoRAG是一种基于检索增强生成(RAG)技术的工具,旨在提升长视频的理解能力。它通过提取视频中的多模态信息(如OCR、ASR和对象检测),并将其与视频帧和用户查询结合,增强大型视频语言模型的处理效果。该技术轻量高效,易于集成,适用于视频问答、内容分析、教育、媒体创作及企业知识管理等多个领域。