工具

Mistral OCR

Mistral OCR 是 Mistral AI 推出的高效 OCR 工具,支持多语言、多格式文档处理,准确率高达 99.02%。具备结构化输出、高速处理、多模态识别及 Doc-as-prompt 功能,适用于科研、文化遗产保护及企业文档管理等场景。

CollovGPT

Collov AI解决人工智能室内设计的未来

Captions AI

Captions.ai 是一款自动转录、字幕和剪辑您的谈话视频的应用程序。

OpenVision

OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列,具备从5.9M到632.1M参数的多种模型,适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略,训练效率比同类模型高2至3倍,在多模态任务中表现优异。支持可变大小patch输入,兼具灵活性与高效性,广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。

猫头音

猫头音是一款基于深度学习技术的AI配音与翻唱工具,支持将文字转化为高质量语音输出,并提供多样化音色选择及丰富的音频处理功能。用户可通过简单操作实现个性化配音、修音翻唱以及音频编辑,广泛适用于视频创作、广告制作、有声读物开发及音乐翻唱等多个领域。

数尖AI播

数尖AI播定位为一个智能化的直播辅助工具(手机+软件),专为本地生活直播和电商领域设计,通过深度采用人工智能技术,为用户提供多语言、多平台的直播话术生成和直播口播声音生成...

Ref

Ref-n-write,一款提高 SCI 写作能力的论文改写、润色神器,Ref-n-write还可以检查文本是否剽窃,以避免学术不端。

easegen

Easegen 是一款开源的 AI 工具,支持数字人课程的制作与管理。它能够批量生成 PPT 课件、克隆数字人形象和声音,并通过 AI 技术实现视频渲染和智能出题。其核心功能包括课程制作、视频管理、智能课件生成、数字人克隆及声音克隆,旨在提升教学内容的互动性和趣味性。Easegen 的技术基础涵盖人工智能、计算机视觉、自然语言处理和语音合成等,适用于在线教育、企业培训、学术研究、语言学习及职业培训

CodeSquire

CodeSquire 是一款 AI 代码编写助手,可帮助数据科学家、工程师和分析师更快、更轻松地编写代码。