多语言

字幕说

字幕说是一款为自媒体创作者设计的在线工具,提供文字转语音、音文对齐、视频合成等功能。支持多语言发音、字幕翻译与优化,帮助用户高效生成高质量视频内容,无需出镜即可完成制作,提升创作效率。

Mistral OCR

Mistral OCR 是 Mistral AI 推出的高效 OCR 工具,支持多语言、多格式文档处理,准确率高达 99.02%。具备结构化输出、高速处理、多模态识别及 Doc-as-prompt 功能,适用于科研、文化遗产保护及企业文档管理等场景。

Lingvotube

一个可以将视频及其隐藏式字幕(CC)翻译成多种语言,并自动生成真实的画外音的视频翻译工具。

Auphonic

Auphonic是一款利用人工智能技术的在线音频后期处理工具,提供自动音量平衡、降噪、混响减少、滤波、静音剪切等功能,适用于播客制作、广播电台、电影视频制作等多个场景,支持多语言语音转文字及视频章节生成,提供免费和多种付费订阅方案。

Spinach AI

Spinach AI 是一款智能会议助手,支持自动记录、生成总结及提取关键任务。具备多语言支持与主流工具集成能力,适用于敏捷开发、跨部门协作等多种场景。提供多种订阅模式,保障数据安全,提升会议效率与团队协作水平。

Captions AI

Captions.ai 是一款自动转录、字幕和剪辑您的谈话视频的应用程序。

易健EasyHealth

易健EasyHealth是一款基于大语言模型技术开发的微信小程序,提供AI智能问答、情感智能算法、健康档案管理、健康数据分析及个性化健康咨询等多功能服务。用户可免费注册并自定义AI助手性格与回答风格,同时享受多语言支持和定制化健康建议,用于个人健康管理、健康咨询、疾病预防、健康教育及心理支持等多个应用场景。

MonkeyOCR

MonkeyOCR是由华中科技大学与金山办公联合开发的文档解析模型,能够高效地将非结构化文档内容转换为结构化信息。其支持多种文档类型和语言,处理复杂文档(如公式、表格)效果显著,处理速度达每秒0.84页。基于SRR三元组范式和MonkeyDoc数据集,模型在准确性和效率上表现优异,适用于自动化业务流程、数字存档、智能教育、医疗记录管理及学术研究等场景。

VideoSrt

VideoSrt是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量的为媒体(视频/音频)生成中/英文字幕、文本文件的业务场景。

Marker

Marker 是一款开源的高精度文档转换工具,支持 PDF、Word 等多种格式向 Markdown、JSON 和 HTML 的转换。它利用深度学习技术自动去除干扰元素,支持多语言处理,具备表格、代码块、公式识别及图像提取等功能,适用于学术研究、技术文档、教育资料等多种场景。同时支持硬件加速和批量处理,提升转换效率与用户体验。