OCR

首页

OCR

列表

默认

浏览次数

发布日期

AI Comic Translate

AI Comic Translate

只需上传您想要翻译的漫画图片，用户只需上传您想要翻译的漫画图片，AI Comic Translate将自动识别文本并在几分钟内生成高质量的翻译。

Ai图片处理 2025年06月05日 39 点赞 0 评论 559 浏览

超级助理

超级助理

超级助理是百度智能云发布的AI浏览器插件，可以随时感知用户的需求，在解析复杂问题、辅助文案创作、智能文档处理、对话式搜索和全文翻译等场景中提供帮助。

Ai办公效率 2025年06月05日 16 点赞 0 评论 557 浏览

T

T-Rex Label是一款基于AI的自动标注工具，依托T-Rex2模型实现一键标注和零样本检测功能。它通过视觉提示简化标注流程，无需额外训练即可直接应用于多种场景，包括农业、工业、生物医药等。用户可通过GitHub账号快速登录并上传数据，利用AI自动生成初步标注结果，随后人工检查与修正，最终导出为常用格式供模型训练使用。

AI项目与工具 2025年06月12日 83 点赞 0 评论 556 浏览

OCRmyPDF

OCRmyPDF

OCRmyPDF 是一款开源的命令行工具，用于将扫描 PDF 转换为可搜索、可编辑的文档。基于 Tesseract OCR 引擎，支持 100 多种语言，具备图像优化、纠偏、清洁等功能，提升识别准确率。支持多核处理与批量操作，适合高效处理大量文件，且完全离线运行，保障数据安全。

AI项目与工具 2025年06月12日 39 点赞 0 评论 556 浏览

Zerox

Zerox

Zerox是一款基于GPT-4o-mini模型的开源OCR工具，支持多种文件格式，具备零样本识别能力，可高效处理扫描文档和复杂布局内容。其输出为Markdown格式，便于编辑与使用，同时提供API接口，适用于企业文档管理、学术研究、法律金融等多个场景，显著提升文档处理效率和准确性。

AI项目与工具 2025年06月12日 20 点赞 0 评论 545 浏览

Ovis2

Ovis2

Ovis2是阿里巴巴国际团队开发的多模态大语言模型，采用结构化嵌入对齐技术提升视觉与文本的融合效果。支持视频、图像和多语言处理，强化了思维链推理和复杂场景下的OCR能力。提供多个参数规模的版本，适用于研究、开发及各类应用场景，展现卓越性能。

AI项目与工具 2025年06月12日 67 点赞 0 评论 544 浏览

Audiocraft/MusicGen

Audiocraft/MusicGen

一个简单而可控的音乐生成LM，具有文本和旋律调节。

创作工具 2026年06月27日 0 点赞 0 评论 522 浏览

TextIn Tools

TextIn Tools

是一款免费在线OCR工具，包含文字识别、表格识别，PDF转文件等功能，识别率高，体验好，免费。

创作工具 2026年06月27日 0 点赞 0 评论 517 浏览

Stirling

Stirling

一个基于Web强大的开源PDF操作工具。它使您能够对 PDF 文件执行各种操作，包括拆分、合并、转换、重组、添加图像、旋转、压缩等。

Ai开源项目 2025年06月05日 22 点赞 0 评论 511 浏览

汉王语音王

汉王语音王

汉王语音王是一款由汉王科技开发的智能语音应用程序，集成了AI语音记录、翻译和同声传译等功能。基于自主研发的多模态大模型，它支持高精度的语音转写、拍摄与录音同步、智能总结和实时翻译，适用于多语言环境。通过集成OCR技术，它能够生成图文并茂的多媒体记录，显著提高工作效率。

AI项目与工具 2025年06月12日 52 点赞 0 评论 506 浏览

微信公众账号

微信扫一扫加关注