开源

mPLUG

mPLUG-Owl3是一款由阿里巴巴开发的多模态AI模型,专注于理解和处理多图及长视频内容。该模型具备高推理效率和准确性,采用创新的Hyper Attention模块优化视觉与语言信息的融合。它已在多个基准测试中展现出卓越性能,并且其源代码和资源已公开,可供研究和应用。

Smart PDFs

Smart PDFs 是一款免费开源的 AI 工具,用于快速提取和总结 PDF 文档的关键信息。它支持学术论文、行业报告和技术文档等多种格式,可在数秒内生成结构清晰的章节式摘要。工具采用 Llama 3.3 模型进行智能处理,并支持图像生成和内容分享功能,适用于学术、职场和个人使用场景。

小顽简报

一款全新、免费且功能强大的PPT插件,提供了一键智能透视、批量图片处理等多种实用功能

Dream

Dream-7B是由香港大学与华为诺亚方舟实验室联合开发的开源扩散模型,支持文本、数学和代码生成,具备双向上下文建模能力和灵活的生成控制。其在通用任务、数学推理和编程方面表现优异,适用于文本创作、数学求解、编程辅助及复杂任务规划等多种场景,提供高效且高质量的生成服务。

AutoAgent

AutoAgent是香港大学开发的零代码LLM智能体框架,支持自然语言交互创建智能助手,适用于搜索、分析和报告生成等场景。提供三种使用模式和双交互模式,兼容多种LLM模型,具备自管理向量数据库和多代理协作能力,部署便捷,适合各类用户高效完成复杂任务。

OpenManus

OpenManus是一款由MetaGPT团队推出的开源AI代理工具,基于模块化设计,支持多种语言模型和工具链,具备代码执行、文件处理、网络搜索和浏览器自动化等功能。其核心优势是实时反馈机制,用户可直观查看AI的思考过程和任务执行状态。同时,它提供灵活的配置选项,便于开发者自定义功能。适用于个人任务自动化、开发者辅助、教育、企业工具开发及研究等多个领域。

Learn Prompting提示工程课程!

Learn Prompting 是一个免费的关于与人工智能通信的免费开源课程,即学习如何给AI下达指令!即怎样与人工智能沟通,让AI来协助我们来完成我们想让它做的事情!

MAGI

MAGI-1是一款由Sand AI开发的开源视频生成大模型,采用自回归架构,支持高效、高质量的视频生成,具备高分辨率输出、无限扩展能力和可控生成特性。适用于内容创作、影视制作、游戏开发等多个领域,技术上融合了自回归去噪、Transformer VAE、扩散模型等创新方法,提升生成效率与稳定性。

Shandu

Shandu 是一款基于 LangChain 和 LangGraph 技术的开源 AI 研究自动化工具,支持多引擎搜索、递归探索和智能网页爬取,能自动生成结构化研究报告。用户可通过命令行输入主题并设置参数,快速输出包含引用的 Markdown 格式文档。适用于学术研究、市场分析、技术探索及教育等多个领域,具备高度灵活性和信息处理能力。

QVQ

QVQ是一个基于Qwen2-VL-72B的开源多模态推理模型,擅长处理文本、图像等多模态数据,具备强大的视觉理解和复杂问题解决能力。它在数学和科学领域的视觉推理任务中表现出色,但在实际应用中仍需解决语言切换、递归推理及图像细节关注等问题。QVQ可广泛应用于教育、自动驾驶、医疗图像分析、安全监控及客户服务等领域。