文字

Umi

Umi-OCR 是一款离线 OCR 工具,支持图片、截图和 PDF 文档的文字识别,具备数学公式与二维码识别功能,可生成可搜索 PDF。支持多语言识别与界面切换,提供命令行和 HTTP 接口调用,适用于文档数字化、数据录入、教育等多个场景。

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别(ASR)模型系列,支持普通话、中文方言和英语,具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本,分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色,且已开源,推动语音识别技术的发展。

OLOCR

一个简单易用的在线 OCR 文字识别工具,支持图片、PDF。用户只需将图像和PDF文件上传到平台,即可提取文本。

Word

我们的文字作为图像插图在不同的字体和不同的文本概念。使用我们的方法,语义调整的字母完全自动创建,然后可以用于进一步的创造性设计,正如我们在这里所演示的那样。

绘声美音

绘声美音是一款集声音克隆、AI变声、文字转语音及多种音频处理功能于一体的在线工具,用户可通过微信公众号便捷使用。支持上传语音训练专属声纹模型,进行歌曲翻唱并生成MV,同时提供变声、音频提取、听歌识曲等功能,适用于娱乐、配音、创作等多种场景。

啤啤熊

一款简单易用的AI绘画工具,用户只需输入一段文字,选择相应的主题和风格,啤啤熊即可免费生成精美的图片。

Exemplary AI

Exemplary AI是一款基于AI技术的内容处理工具,可将长视频和音频转换为短视频片段、文字记录及摘要等形式,同时支持多语言字幕生成和社交媒体优化。其主要功能包括视频剪辑、文本记录、AI写作、多语言支持等,广泛应用于社交媒体营销、教育培训、企业培训等领域,助力用户高效创作并传播优质内容。

PearOCR

PearOCR,一个完全免费的在线OCR图像转文字网站。支持简体中文、繁体中文、英文、日文、韩文五种语言。