开源

GPT学术优化

GPT学术优化是一款专为学术研究与写作设计的开源工具,提供论文翻译、代码解析、信息提取、LaTeX校对、论文润色及摘要生成等功能。其模块化设计支持灵活扩展,通过大型语言模型实现高效的语言处理任务,适用于学术研究、教育辅导、项目开发和技术文档撰写等多个场景。

GenCast

GenCast是一款基于扩散模型的AI气象预测工具,可提供长达15天的高精度全球天气预报,尤其擅长预测极端天气事件。它采用0.25°纬度-经度分辨率生成高精度集合预报,并通过并行计算在8分钟内完成预测。GenCast已开源,支持学术界和行业用户进一步研究与应用。

AutoGen Studio

AutoGen Studio是一款由微软研究院推出的开源工具,旨在简化多智能体系统的构建、调试和评估。它提供拖放式界面和Python API,支持声明式规范定义智能体及工作流,具备交互式评估、可重用组件库等功能,适用于客户服务、团队协作、教育、内容创作等多个领域。

NotebookLlama

NotebookLlama是一款基于Meta开发的开源工具,能够将PDF文档自动转换为高质量播客内容。它通过LLaMa模型完成PDF预处理、文本转播客脚本、增加戏剧性元素以及文本转语音合成等步骤,无需人工干预即可生成专业水准的播客。NotebookLlama提供了详细的教程和操作指南,并支持多种应用场景,包括教育、新闻、企业培训和有声书制作等。

ShareX

ShareX是一款免费且开源的高级截图工具和屏幕记录器,不仅可以截图,还可以录屏,自动添加水印和阴影,适用于Windows系统。

OpenDeepResearcher

OpenDeepResearcher 是一款开源 AI 研究工具,通过迭代搜索和 LLM 驱动的推理,实现自动化信息查询、分析与报告生成。支持异步处理和去重功能,提升效率并减少重复工作。适用于金融、科研、政策等领域,为用户提供高效、低成本的研究解决方案。系统可自动完成从搜索到总结的全过程,广泛应用于文献综述、行业分析、公司研究等场景。

MooER

MooER是一款基于国产全功能GPU训练的开源音频理解大模型,由摩尔线程推出。它能够进行中文和英文的语音识别,并具备中译英的语音翻译能力。MooER在Covost2中译英测试集中取得25.2的BLEU分数,接近工业级标准。其主要功能包括语音识别、语音翻译、高效率训练以及开源模型。该模型采用深度学习架构和端到端训练模式,具有强大的多语言处理能力和广泛的适用性。

AuraFlow

AuraFlow v0.1是一款由Fal团队开发的开源AI文生图模型,拥有6.8B参数量。该模型通过优化的MMDiT架构提升了计算效率和可扩展性。AuraFlow在生成精确图像方面表现出色,特别是在物体空间构成和色彩表现上具有优势。此外,它采用了最大更新参数化技术,增强了学习率迁移的稳定性。AuraFlow支持文本到图像的生成,适用于艺术创作、媒体内容生成、游戏开发及广告和营销等多种应用场景。

VidTok

VidTok(Video Tokenizer)是一款由微软开发的开源视频处理工具,通过高效的算法将视频内容转化为“视频词”,支持连续与离散分词化,具有灵活的压缩率和多样的隐空间,适用于视频生成、内容建模及数据压缩等场景。其混合模型架构结合卷积与采样模块,辅以有限标量量化技术,实现了高质量视频重建与高效数据处理。

DeepClaude

DeepClaude 是一款高性能开源 AI 工具,融合 DeepSeek R1 和 Claude 模型,具备推理、创造力和代码生成能力。它提供零延迟响应、端到端加密和本地 API 管理,保障数据安全。支持高度自定义,适用于智能客服、代码生成、推理分析及教育等多场景,满足多样化需求。