多语言 - 智狐AI导航

ebook2audiobookXTTS

ebook2audiobookXTTS是一款开源AI工具，可将EPUB、PDF、MOBI等多种电子书格式转换为高质量的有声书（.m4b）。通过集成Calibre和Coqui XTTS技术，支持多语言处理和章节识别，同时保留电子书元数据，适用于个人学习、教育培训、企业培训以及公共图书馆等场景，帮助用户高效获取知识。

AI项目与工具 2025年06月12日 78 点赞 0 评论 866 浏览

SignLLM

SignLLM是一款支持多语言手语生成的AI模型，能将文本转换为自然流畅的手语视频，覆盖包括ASL、GSL、LSA、KSL在内的八种手语。其核心技术包括离散化与层次化表示、自监督学习、符号-文本对齐等。该工具可用于教育、医疗、法律、媒体等多个场景，提升听障人群的沟通便利性与信息获取能力。

AI项目与工具 2025年06月12日 86 点赞 0 评论 867 浏览

BoomCut爆剪辑

小影科技旗下的 AI 内容创意产品与服务平台，提供一站式视频本地化解决方案，涵盖视频翻译、模特换脸、音色克隆等功能。

视频剪辑 2025年06月05日 11 点赞 0 评论 867 浏览

GradeAssist

GradeAssist是一款面向教师的AI辅助论文评分工具，支持自定义评分标准、抄袭检测及AI写作分析等功能，可快速生成客观一致的评分结果并提供个性化反馈，有助于提升评分效率、维护学术诚信及减轻教师工作压力。

AI项目与工具 2025年06月12日 52 点赞 0 评论 867 浏览

Keevx

Keevx是一款专注于AI数字人视频创作的工具，主要面向海外中小企业和个人创作者。它提供AI智能脚本生成、翻译功能，搭配优质公共人像和模板，支持一键生成营销视频。用户可上传自有脚本，选择数字人形象和语音来制作视频，适用于电商产品展示、员工培训、社交媒体内容创作及品牌宣传等场景。

AI项目与工具 2025年06月11日 97 点赞 0 评论 867 浏览

Playground v3

Playground v3是一款基于大型语言模型（LLM）的文本到图像生成工具，具备240亿参数量的潜扩散架构（LDM），能够精准理解和生成复杂的图像内容，支持RGB颜色控制和多语言文本生成。其核心功能包括文本到图像生成、图形设计、RGB颜色控制和多语言支持，广泛应用于设计、内容创作、游戏开发、广告等多个领域。

AI项目与工具 2025年06月12日 52 点赞 0 评论 868 浏览

AI Voice Cloning

一个提供超真实的AI语音克隆生成器，只需要3秒的音频样本就可以克隆英语、普通话、日语、韩语等语言的声音，生成与真人无异的逼真语音。

Ai语音工具 2025年06月05日 17 点赞 0 评论 871 浏览

MacWhisper是一款基于OpenAI Whisper技术的AI音频转文字工具。它能够在本地设备上将音频文件快速转录成文本，并支持多种语言。该工具具有多种音频和视频格式兼容性，提供不同的转录模型选择，支持字幕导出，且具备视频播放功能。最新版本增加了基于Apple芯片的硬件加速，提升了实时语音识别效率，并集成了OpenAI语言模型以提高转录和翻译的准确性。MacWhisper适用于记者、媒体工作

AI项目与工具 2025年06月12日 15 点赞 0 评论 872 浏览

阿里云盾-文本智能审核

多语言多场景多种违规文本检测

AI写作对话 2026年06月27日 0 点赞 0 评论 872 浏览

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库，具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别，适用于语音助手、会议记录、实时字幕等场景，提供灵活的音频输入与预处理机制，便于开发者快速集成和扩展。

AI项目与工具 2025年06月12日 97 点赞 0 评论 872 浏览

多语言

首页

多语言

列表

默认

浏览次数

发布日期