支持

Free Subtitles

Free Subtitles,免费AI在线字幕生成工具,免费将音频和视频转录为文本,支持111种语言,102种语言的翻译。

Deep Live Cam

一款开源的实时人脸交换和AI视频换脸工具。它能够利用单张图像对视频或其他图像进行人脸替换,适用于视频制作、动画创作等多种场景。

Fish Audio

Fish Audio是一款生成式AI文本转语音(TTS)和声音克隆平台,支持多种语言和声音风格,可将文本转换为自然流畅的语音。用户可上传音频样本克隆特定人物的声音,并通过API接口集成到应用程序中。Fish Audio适用于视频制作、有声读物、语音助手、教育与培训以及娱乐创意等领域,满足个性化语音内容生成需求。

Mistral Small 3.1

Mistral Small 3.1 是一款由 Mistral AI 开发的开源多模态 AI 模型,拥有 240 亿参数,支持文本与图像处理,具备长达 128k tokens 的上下文窗口和每秒 150 token 的推理速度。采用 Transformer 架构与 MoE 技术,提升计算效率,支持多语言和本地部署。适用于文档处理、图像分析、质量检测、虚拟助手等多种场景。

QANDA

QANDA是一款由韩国Mathpresso公司开发的AI学习应用,主要面向学生,提供数学及其他学科的即时解答与详细解析。用户可通过拍照或输入问题,获取分步解答、常见错误提示及个性化辅导。应用还支持多语言、学习数据分析和类似题目推荐,适用于家庭作业、考试复习、日常学习及教学辅助等多种场景,帮助用户提升学习效率和理解能力。

Chikka.ai

Chikka.ai 是一款基于AI语音代理的客户访谈平台,支持多语言、大规模对话,提供个性化访谈设计、自动转录与分析功能。适用于客户反馈、员工意见、产品开发等场景,帮助企业高效获取洞察,优化决策流程。

X Detector

X Detector是一款高效且专业的多语言AI内容检测工具,支持超过20种语言,检测准确率达99%以上。它通过先进的算法分析文本特征,快速识别AI生成的内容,具备数据安全、用户友好的特点,并提供高精度检测、实时分析等功能。X Detector广泛应用于教育、出版、新闻、内容创作等领域,旨在维护学术诚信和内容真实性。

BizGen

BizGen是由清华大学与微软研究院联合开发的AI信息图生成工具,能将长篇文章自动转化为专业级的信息图和幻灯片。其核心技术包括高质量数据集Infographics-650K和“布局引导的交叉注意力机制”,可精准控制图像中各区域的文本与视觉元素。支持多语言和多种风格,适用于商业汇报、产品展示、学术研究等多个场景,具备高准确性与排版质量。

LMEval

LMEval是谷歌推出的开源框架,用于简化大型语言模型(LLMs)的跨提供商评估。它支持多模态(文本、图像、代码)和多指标评估,兼容Google、OpenAI、Anthropic等主流模型提供商。LMEval基于增量评估引擎,节省时间和计算资源,并通过自加密的SQLite数据库安全存储评估结果。LMEvalboard提供交互式可视化界面,帮助用户分析模型性能并直观比较不同模型的优缺点。

Coco视频解析下载

Coco视频解析下载功能多样,支持单个视频提取、视频主页提取、多链接批量提取、提取音频等,全网视频解析下载可以解析各种视频网站上的视频。