文本识别 - 智狐AI导航

TextHarmony

TextHarmony是一款由华东师范大学与字节跳动联合开发的多模态生成模型，擅长视觉与文本信息的生成与理解。该模型基于Slide-LoRA技术，支持视觉文本生成、编辑、理解及感知等功能，广泛应用于文档分析、场景文本识别、视觉问题回答、图像编辑与增强以及信息检索等领域。通过高质量数据集的构建与多模态预训练，TextHarmony在视觉与语言生成任务中表现出色。

AI项目与工具 2025年06月12日 47 点赞 0 评论 756 浏览

Manga Translator

Manga Translator是一款基于AI技术的Chrome扩展工具，支持超过135种语言的漫画对话翻译。它能够处理水平和竖排文本，适用于多种语言环境。用户可以轻松上传漫画图片，获取快速准确的翻译结果，广泛应用于跨语言阅读、语言学习及专业翻译场景。

AI项目与工具 2025年06月12日 45 点赞 0 评论 774 浏览

pdf

pdf-craft 是一款专注于将扫描书籍的 PDF 文件转换为 Markdown 和 EPUB 格式的工具。它结合 DocLayout-YOLO 布局分析与 PaddleOCR 文本识别技术，精准提取正文内容并优化阅读顺序，支持跨页处理与结构化输出。适用于学术研究、电子书制作、文档存档及教育资料整理等多种场景。

AI项目与工具 2025年06月12日 23 点赞 0 评论 766 浏览

CleanShot X

一款为Mac设计的强大截图和屏幕录制工具，具备快速访问、智能标注、云协作、文本识别等多种实用功能。

直播录屏 2025年06月05日 68 点赞 0 评论 638 浏览

GOT-OCR2.0

创新的OCR模型，它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景，GOT-OCR 2.0都能提供强大的支持。

Ai平台模型 2026年06月27日 0 点赞 0 评论 602 浏览

GOT

创新的OCR模型，它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景，GOT-OCR 2.0都能提供强大的支持。

Ai平台模型 2026年06月27日 0 点赞 0 评论 356 浏览

文本识别

首页

文本识别

列表

默认

浏览次数

发布日期

TextHarmony

Manga Translator

pdf

CleanShot X

GOT-OCR2.0

GOT

文本识别 首页 文本识别

列表 默认 浏览次数 发布日期

TextHarmony

Manga Translator

pdf

CleanShot X

GOT-OCR2.0

GOT

文本识别

首页

文本识别

列表

默认

浏览次数

发布日期