文字 - 智狐AI导航

Monoxer Junior

Monoxer Junior是一款由日本公司Monoxer开发的AI学习应用，专为小学新生设计。它基于人工智能技术，根据儿童的学习水平和记忆状态智能生成练习题，涵盖假名、汉字等内容，支持家庭和学校使用。应用具备学习进度可视化功能，便于家长了解孩子学习情况。目前已在日本超过3400家教育机构推广，用户超500万，有效提升学习效率和兴趣。

AI项目与工具 2025年06月12日 43 点赞 0 评论 939 浏览

WhisperKeyboard

WhisperKeyboard 是一款基于 OpenAI Whisper 技术的 AI 语音输入工具，支持多语言实时语音转文字，适用于写作、编程、会议记录等场景。具备离线识别、文本润色、多语言翻译和隐私保护等功能，兼容多平台，提升输入效率与文本质量。

AI项目与工具 2025年06月12日 76 点赞 0 评论 756 浏览

绘声美音

绘声美音是一款集声音克隆、AI变声、文字转语音及多种音频处理功能于一体的在线工具，用户可通过微信公众号便捷使用。支持上传语音训练专属声纹模型，进行歌曲翻唱并生成MV，同时提供变声、音频提取、听歌识曲等功能，适用于娱乐、配音、创作等多种场景。

AI项目与工具 2025年06月12日 39 点赞 0 评论 739 浏览

OCRmyPDF

OCRmyPDF 是一款开源的命令行工具，用于将扫描 PDF 转换为可搜索、可编辑的文档。基于 Tesseract OCR 引擎，支持 100 多种语言，具备图像优化、纠偏、清洁等功能，提升识别准确率。支持多核处理与批量操作，适合高效处理大量文件，且完全离线运行，保障数据安全。

AI项目与工具 2025年06月12日 39 点赞 0 评论 556 浏览

LipRead Pro

LipRead Pro 是一款基于AI技术的视频唇读工具，可将视频中的唇部动作转换为文字，支持多语言和口音识别。其高精度算法确保了文字输出的准确性，适用于内容创作、无障碍辅助、安全监控、历史档案修复等多种场景。操作简便，处理高效，注重用户数据隐私保护，适合专业用户和普通用户使用。

AI项目与工具 2025年06月12日 100 点赞 0 评论 922 浏览

Seede.ai

Seede.ai 是一款AI驱动的图像设计工具，支持通过文字描述或参考图片生成设计，提供智能压缩、背景移除、图像放大等免费图像处理功能，并结合AI辅助优化，帮助用户快速制作专业级设计作品，适用于社交媒体、广告、电商、艺术创作等多个场景。

AI项目与工具 2025年06月12日 39 点赞 0 评论 847 浏览

AstrBot

AstrBot是一款多功能聊天机器人及开发框架，支持多种大语言模型和消息平台，具备多轮对话、语音转文字、网页搜索等功能。它采用模块化设计，支持插件开发和多平台部署，适用于企业客服、个人助手、教育辅导等多个场景，提供高效的智能交互体验。

AI项目与工具 2025年06月12日 55 点赞 0 评论 656 浏览

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别（ASR）模型系列，支持普通话、中文方言和英语，具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本，分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色，且已开源，推动语音识别技术的发展。

AI项目与工具 2025年06月12日 82 点赞 0 评论 750 浏览

WhisperChain

WhisperChain 是一款开源语音识别工具，支持实时语音转文本并提供文本优化功能，可去除填充词、优化语法。用户可通过全局热键快速启动语音输入，处理结果自动复制到剪贴板。支持 Streamlit 界面与 FastAPI 架构，适用于会议记录、写作辅助等场景。

AI项目与工具 2025年06月12日 57 点赞 0 评论 667 浏览

TokenFD是由上海交通大学与美团联合开发的细粒度图文对齐基础模型，专为文档理解任务设计。通过图像与语言Token的统一特征空间对齐，支持Token级图文交互，提升了多模态任务性能。其基于自研的TokenIT数据集进行训练，涵盖2000万张图像和18亿高质量Token-Mask对，覆盖多种文本图像类型。TokenFD可用于文档处理、图像审查、文字检索及大模型知识增强等多个领域，具有广泛的适用性和

AI项目与工具 2025年06月12日 90 点赞 0 评论 679 浏览

文字

首页

文字

列表

默认

浏览次数

发布日期