moonshot-v1-vision-preview 简介
moonshot-v1-vision-preview 是月之暗面推出的一款多模态图像理解模型,作为 moonshot-v1 模型系列的重要组成部分,该模型在图像识别、文字识别及数据解析等方面表现出色。它能够准确区分具有高度相似性的图像内容,如蓝莓松饼与吉娃娃等复杂场景。同时,模型具备较强的 OCR 能力,可有效识别手写文档中的文字信息,例如收据和快递单。此外,该模型还能分析图表中的数据,并从美学角度进行评价。其基于 API 接口提供服务,支持多轮对话和流式输出等功能。
moonshot-v1-vision-preview 的主要功能
- 图像识别:具备高精度的图像识别能力,能够准确区分细节相似的图像对象。
- OCR 文字识别:在文档识别和图像理解方面表现优异,能准确提取潦草手写内容。
- 图像数据分析:可识别并分析图表中的数据信息,同时具备对图像美学特征的评估能力。
- API 集成:支持通过 API 接口调用,便于用户将其集成至自有系统中。
moonshot-v1-vision-preview 的项目信息
- 项目官网:https://platform.moonshot.cn/docs/guide/use-kimi-vision-model
- 产品体验:Kimi智能助手
moonshot-v1-vision-preview 的使用说明
- 支持特性:多轮对话、流式输出、工具调用、JSON Mode、Partial Mode
- 暂不支持功能:
- 联网搜索:目前不支持
- Context Caching:不支持创建包含图片内容的缓存,但支持使用已有缓存调用视觉模型
- URL 图片格式:不支持,仅支持 base64 编码的图片
moonshot-v1-vision-preview 的定价方案
- moonshot-v1-8k-vision-preview:1M tokens ¥12.00
- moonshot-v1-32k-vision-preview:1M tokens ¥24.00
- moonshot-v1-128k-vision-preview:1M tokens ¥60.00
moonshot-v1-vision-preview 的应用场景
- 内容审核与分类:适用于电商商品管理、科研教育中的动植物识别以及平台内容审核。
- 文档与数据处理:可用于合同、发票等文档的文字提取,以及成绩表、财务报表的数据分析。
- 医学与工业应用:辅助医学影像分析,提升诊断准确性;用于工业产品缺陷检测。
- 智能交互服务:在客服、教育和智能家居等领域提供更智能的多模态交互体验。
- 美学与设计评估:从美学角度分析图像,为广告、网页设计提供优化建议。
发表评论 取消回复