教育

QVQ

QVQ是一个基于Qwen2-VL-72B的开源多模态推理模型,擅长处理文本、图像等多模态数据,具备强大的视觉理解和复杂问题解决能力。它在数学和科学领域的视觉推理任务中表现出色,但在实际应用中仍需解决语言切换、递归推理及图像细节关注等问题。QVQ可广泛应用于教育、自动驾驶、医疗图像分析、安全监控及客户服务等领域。

Pineapple Builder

Pineapple Builder是一款专为企业设计的AI驱动网站构建工具,支持超过99种语言,提供跨平台的一体化服务。用户可通过简单描述生成个性化网站,并自定义网站风格。该工具具备SEO优化、集成分析和第三方服务等功能,帮助企业快速上线并扩展在线业务,同时提供全天候客户支持和丰富的教育资源。

MedRAX

MedRAX是一款面向胸部X光检查的医学推理AI系统,结合多模态大模型与专业工具,实现复杂医疗问题的动态处理。支持多步骤推理、精准诊断与多种影像分析功能,适用于临床支持、教育培训及远程医疗等场景。系统具备良好的扩展性与部署灵活性,已在多项基准测试中表现优异。

Manga TV

一个由人工智能驱动的可以通过文本自动生成漫画视频的平台,Manga TV彻底改变了漫画创作的过程。

Versatile

Versatile-OCR-Program是一款开源多模态OCR工具,支持从教育材料中提取文本、公式、表格等结构化数据,输出为JSON或Markdown格式,准确率高达90%-95%。它基于DocLayout-YOLO、Google Vision和MathPix等技术,支持多语言处理,适用于教育数据集制作、教学辅助、AI模型训练及个人学习等场景。

NEXUS

NEXUS-O是一款由多家知名机构联合开发的多模态AI模型,能够处理音频、图像、视频和文本等多种输入,并以相应形式输出结果。它在视觉理解、音频问答、语音识别和翻译等方面表现出色,具备强大的跨模态对齐与交互能力。模型基于视觉语言预训练,结合高质量音频数据提升性能,并通过多模态任务联合训练增强泛化能力。适用于智能语音助手、视频会议、教育、智能驾驶、医疗健康等多个领域。

Docmatix

Docmatix 是一个专为文档视觉问答任务设计的大规模数据集,包含240万张图像和950万个问题-答案对,源自130万个PDF文档。数据集覆盖广泛,包括扫描图片、PDF文件和数字文档,且具有高质量的问答对。Docmatix 支持模型训练和微调,可用于训练视觉语言模型,提高其在理解和回答与文档内容相关问题方面的性能。应用场景包括自动化客户服务、智能文档分析、教育和学术研究以及业务流程自动化等。

Midjourney 学习导航

坦率说来,线性的教程,并不是学习 Midjourney 最好的方法,可能未来有了 AI 技术后,我能制作一个更牛逼的教程。为了能让不同水平的朋友快速了解和学会 Midjourney ,我特意制作了本学习导航,希望它能帮助你更好地学习。如果你是想教小朋友如何使用孩子是人类的未来,所以如果你有小孩,不妨跟小朋友一起学习 不过很抱歉,因为身边没有可实验的样本,所以可能需要你根据小朋友的情况,对这份导航进

StudyX

StudyX是一款基于AI技术的学生学习辅助工具,提供多学科作业解答、数学解题分析、AI辅导和社区互动等功能。支持文字、图片和PDF输入,具备个性化学习空间和全天候专家支持,适用于各类学生群体,有效提升学习效率和知识掌握能力。

novelcrafter

Novelcrafter是一款面向小说作者的AI辅助写作工具,集成了角色设定、情节规划、灵感捕捉等功能,同时支持AI交互式对话与大纲细化,助力从创意萌芽到最终成稿的全流程。具备高度灵活性和隐私保障,适合各类写作需求。