文字

奇布塔

奇布塔是一个依托AI技术的有声绘本创作平台,提供文字、图片、声音和视频一体化编辑工具,集成丰富的资源库,支持用户创作高质量有声作品。平台特色包括图片转绘、角色画面分离及社区互动功能,广泛适用于儿童教育、语言学习、早期教育及家庭娱乐等领域。

神采PromeAI

神采PromeAI是一款面向建筑师、室内设计师、产品设计师及游戏动漫设计师的AI设计助手。它通过强大的AIGC模型风格库,支持用户通过文字描述、草图或图片上传,快速生成高质量的设计图。此外,PromeAI还具备旧建筑翻新功能,能够提供高效的旧区改造设计方案,并支持多种风格转换和细节调整,从而实现卓越的视觉效果。

MacWhisper

MacWhisper是一款基于OpenAI Whisper技术的AI音频转文字工具。它能够在本地设备上将音频文件快速转录成文本,并支持多种语言。该工具具有多种音频和视频格式兼容性,提供不同的转录模型选择,支持字幕导出,且具备视频播放功能。最新版本增加了基于Apple芯片的硬件加速,提升了实时语音识别效率,并集成了OpenAI语言模型以提高转录和翻译的准确性。MacWhisper适用于记者、媒体工作

Lobe Chat

Lobe Chat 是一个免费开源的高性能 AI 聊天机器人框架,具备多种功能,如 GPT-4 视觉识别、文字语音转换、灵活的插件系统及个性化主题模式。用户能够轻松部署和扩展功能,适用于各种场景。该框架已在 GitHub 上获得近 14K 星标,展示了其受欢迎程度和实用性。

录音识别王

录音识别王,支持录音实时转文字、视频转文字、智能配音及图片转文字等功能,高效精准的录音识别技术,智能提取音频中的文字,支持TXT、WORD等格式导出,适用于各种录音制作场景。

LipRead Pro

LipRead Pro 是一款基于AI技术的视频唇读工具,可将视频中的唇部动作转换为文字,支持多语言和口音识别。其高精度算法确保了文字输出的准确性,适用于内容创作、无障碍辅助、安全监控、历史档案修复等多种场景。操作简便,处理高效,注重用户数据隐私保护,适合专业用户和普通用户使用。

UniScribe

一个帮你更快的从音视频中获取信息的音视频转录和翻译工具。UniScribe能快速将本地音频、视频文件或 YouTube 视频转化为简短摘要,帮助您轻松掌握要点,支持98种语言。

易飞文字识别

免费在线批量图片文字提取,支持中英文等多种语言的高效准确识别,一键复制文本导出Word。

FillDream

一款基于人工智能的图像修改工具,允许用户通过输入提示来填充和修改图像。

AsrTools

AsrTools是一款无需复杂配置的智能语音转文字工具,支持多种音频格式的转换,生成SRT和TXT字幕文件,适用于视频字幕、会议记录、音频转写等多个场景。它具有友好的用户界面、高效的多线程处理能力以及详细的技术文档,旨在为用户提供便捷、准确的语音转文字解决方案。