文字

WhisperKeyboard

WhisperKeyboard 是一款基于 OpenAI Whisper 技术的 AI 语音输入工具,支持多语言实时语音转文字,适用于写作、编程、会议记录等场景。具备离线识别、文本润色、多语言翻译和隐私保护等功能,兼容多平台,提升输入效率与文本质量。

CopyFish

一个免费的 OCR 程序,可从图片、视频和 PDF 文件中提取文本。

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别(ASR)模型系列,支持普通话、中文方言和英语,具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本,分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色,且已开源,推动语音识别技术的发展。

擎舵

擎舵是百度营销推出的多模态AIGC创意生产平台,专注于视频、图片、文字等内容的智能生成。平台通过百度大模型技术支持,实现一键生成视频、图片、文字,自动识别视频素材内容,生成营销图,制作数字人视频,支持图片数字人生成及数字人形象与语音定制。擎舵服务于教育、汽车、旅游等多个行业,提供全流程AI赋能,帮助用户提升营销效率。

啤啤熊

一款简单易用的AI绘画工具,用户只需输入一段文字,选择相应的主题和风格,啤啤熊即可免费生成精美的图片。

Patterned AI

PatternedAI 是一种使用人工智能为任何表面生成无缝图案的工具。您可以使用它来设计织物、墙纸、包装等的图案。

ImgCreator AI

Imgcreator AI,一款强大而灵活的在线图片生成工具,您只需在输入框中输入您想要转化为图像的文本。

音鹿

音鹿是一款基于AI技术的音频编辑工具,主要功能包括文字转语音、音色选择、AI翻唱及音频编辑(剪切、合并、混音、音量调节、变速变调)。该工具内置大量音色模型,支持实时预览与参数调整,广泛适用于社交媒体、广告宣传、教育培训等领域,帮助用户高效完成音频创作。