文档

Lingvanex

一个全面的翻译工具,包括文本、语音、图片和文档翻译应用。它利用神经机器翻译技术提高生产力。

AI灵感PPT

用创作点睛,用AI添彩,一键生成PPT,在线灵活编辑PPT。轻松呈现精彩,AI灵感PPT同时也支持AI绘图、AI配音、AI写作。

OmniParse

OmniParse是一款开源数据解析平台,支持多种文件类型的非结构化数据转换为结构化格式,包括文档、图像、视频、音频及网页内容。其核心功能涵盖表格提取、图像字幕生成、音视频转录以及网页内容结构化处理,利用自然语言处理、光学字符识别及深度学习技术提升解析效率与准确性。OmniParse完全在本地运行,确保数据隐私与安全,广泛应用于文档自动化处理、客户服务、市场研究、法律合规及医疗记录管理等领域。

北极象沉浸式翻译

一款免费的沉浸式网页翻译、划词翻译,集成了DeepL、谷歌、百度、GPT等前沿技术,视频双语字幕翻译。

PaliGemma 2 mix

PaliGemma 2 Mix 是谷歌 DeepMind 推出的多任务视觉语言模型,支持图像描述、目标检测、OCR、文档理解等功能。模型提供多种参数规模和分辨率选项,适用于不同场景。其基于开源框架开发,易于扩展,可通过简单提示切换任务。适用于科学问题解答、文档分析、电商内容生成等多个领域。

Vision Parse

Vision Parse 是一款开源工具,旨在通过视觉语言模型将 PDF 文件转换为 Markdown 格式。它具备智能识别和提取 PDF 内容的能力,包括文本和表格,并能保持原有格式与结构。此外,Vision Parse 支持多种视觉语言模型,确保解析的高精度与高速度。其应用场景广泛,涵盖学术研究、法律文件处理、技术支持文档以及电子书制作等领域。

Deepl翻译

DeepL 自德国的初创公司,官网号称全世界最准确的翻译,最初的翻译服务主要以欧洲语系为主。在中英互翻、日英互翻的表现上远胜于 Google 翻译。

TextIn

TextIn是一款利用OCR技术实现文字识别的AI平台,支持多语言且具备强大的图像处理能力。它可以从各种类型的文档中提取结构化信息,并提供灵活的部署选项,适用于金融、物流、制造业等多个领域。TextIn通过智能算法优化文档处理流程,帮助企业提升效率。

SmolDocling

SmolDocling-256M-preview 是一款轻量级多模态文档处理模型,能将图像文档高效转换为结构化文本,支持文本、公式、图表等多种元素识别。模型参数量仅256M,推理速度快,适合学术与技术文档处理。具备OCR、布局识别、格式导出等功能,并兼容Docling,适用于文档数字化、科学研究及移动环境应用。

Pantheon AI

Pantheon AI是一款基于AI技术的建筑设计平台,专注于简化建筑设计流程,从初步设计到施工文档生成均实现智能化操作。平台的核心功能包括快速生成可编辑的3D模型、自动化处理重复性任务、确保设计合规性、支持快速迭代以及提供实时成本估算。适用于办公楼、多户型住宅、酒店建设及建筑翻新等多个场景,助力用户高效完成建筑项目。