OCR

拍试卷

拍试卷是一款基于OCR技术的试卷扫描与处理软件,具备高清扫描、手写内容擦除、试卷还原等功能,支持将试卷内容转换为可编辑的文本格式、Word文档或PDF文件,适用于教师备课、学生自学、学术研究及出版行业等多个场景,同时提供图片文字识别、公式识别和PDF扫描识别等特色功能,全面提升工作效率。

Manga Image Translator

Manga Image Translator 是一个开源的漫画图片文字翻译工具,基于 OCR 和机器翻译技术,实现对漫画和图片中文字的自动识别与翻译。它支持多语言翻译,包括日文、中文、英文和韩文,并具备图像合成能力,保持原图风格。工具提供批量处理和在线/离线翻译功能,适用于漫画爱好者、语言学习者以及出版商等用户群体。

POINTS 1.5

POINTS 1.5 是腾讯微信开发的多模态大模型,基于LLaVA架构设计,包含视觉编码器、投影器和大型语言模型。它在复杂场景OCR、推理、关键信息提取、数学问题解析及图片翻译等方面表现突出,适用于票据识别、自动客服、新闻摘要、学术论文处理、旅游翻译和在线教育等多个领域。该模型通过高效的数据处理和特征融合技术,实现了跨模态任务的精准处理与高效输出。

PaliGemma 2

PaliGemma 2是一款由Google DeepMind研发的视觉语言模型(VLM),结合了SigLIP-So400m视觉编码器与Gemma 2语言模型,支持多种分辨率的图像处理。该模型具备强大的知识迁移能力和出色的学术任务表现,在OCR、音乐乐谱识别以及医学图像报告生成等方面实现了技术突破。它能够处理多模态任务,包括图像字幕生成、视觉推理等,并支持量化和CPU推理以提高计算效率。

Coral AI

Coral AI 是一款基于 AI 的文档分析平台,专注于智能搜索、摘要生成、翻译及问答功能。它支持超过 90 种语言,适用于学术研究、法律分析和商业报告等场景,特别适合处理大量文档。主要功能包括智能搜索、自动摘要生成、实时翻译、引用生成、跨文档搜索、文档标记与管理等,并支持多种文件类型和图像分析。

AutoConsis

AutoConsis是一款基于深度学习和大型语言模型的UI内容一致性智能检测工具,能够自动识别和提取界面中的关键数据,并对数据一致性进行高效校验。它支持多业务场景适配,具备高泛化性和高置信度,广泛应用于电商、金融、旅游等多个领域,助力提升用户体验和系统可靠性。

字狐AI

字狐AI是一款集成多种AI功能的浏览器插件,主要功能包括智能问答、网页信息提取、写作辅助、PDF转换及OCR文字识别。用户可通过语音或文字与之互动,快速获取所需信息并提升工作效率。支持多语言识别与编辑,适用于办公文档处理、写作创作、资料阅读及PPT制作等场景。

T

T-Rex Label是一款基于AI的自动标注工具,依托T-Rex2模型实现一键标注和零样本检测功能。它通过视觉提示简化标注流程,无需额外训练即可直接应用于多种场景,包括农业、工业、生物医药等。用户可通过GitHub账号快速登录并上传数据,利用AI自动生成初步标注结果,随后人工检查与修正,最终导出为常用格式供模型训练使用。

TextIn

TextIn是一款利用OCR技术实现文字识别的AI平台,支持多语言且具备强大的图像处理能力。它可以从各种类型的文档中提取结构化信息,并提供灵活的部署选项,适用于金融、物流、制造业等多个领域。TextIn通过智能算法优化文档处理流程,帮助企业提升效率。

UPDF

UPDF是一款基于AI技术的多功能PDF工具,支持文本编辑、图片编辑、注释、转换、OCR识别、表单填写及签名等功能。其特色包括跨平台兼容性(Windows、Mac、Android、iOS及在线版本)、AI辅助阅读体验(总结、翻译、解释)以及便捷的商务与学术应用场景。适用于文档编辑、学术研究、商务沟通及法律文件处理等多样化需求。