moonshot-v1-vision-preview 简介

moonshot-v1-vision-preview 是月之暗面推出的一款多模态图像理解模型,作为 moonshot-v1 模型系列的重要组成部分,该模型在图像识别、文字识别及数据解析等方面表现出色。它能够准确区分具有高度相似性的图像内容,如蓝莓松饼与吉娃娃等复杂场景。同时,模型具备较强的 OCR 能力,可有效识别手写文档中的文字信息,例如收据和快递单。此外,该模型还能分析图表中的数据,并从美学角度进行评价。其基于 API 接口提供服务,支持多轮对话和流式输出等功能。

moonshot-v1-vision-preview 的主要功能

  • 图像识别:具备高精度的图像识别能力,能够准确区分细节相似的图像对象。
  • OCR 文字识别:在文档识别和图像理解方面表现优异,能准确提取潦草手写内容。
  • 图像数据分析:可识别并分析图表中的数据信息,同时具备对图像美学特征的评估能力。
  • API 集成:支持通过 API 接口调用,便于用户将其集成至自有系统中。

moonshot-v1-vision-preview 的项目信息

  • 项目官网:https://platform.moonshot.cn/docs/guide/use-kimi-vision-model
  • 产品体验Kimi智能助手

moonshot-v1-vision-preview 的使用说明

  • 支持特性:多轮对话、流式输出、工具调用、JSON Mode、Partial Mode
  • 暂不支持功能
    • 联网搜索:目前不支持
    • Context Caching:不支持创建包含图片内容的缓存,但支持使用已有缓存调用视觉模型
    • URL 图片格式:不支持,仅支持 base64 编码的图片

moonshot-v1-vision-preview 的定价方案

  • moonshot-v1-8k-vision-preview:1M tokens ¥12.00
  • moonshot-v1-32k-vision-preview:1M tokens ¥24.00
  • moonshot-v1-128k-vision-preview:1M tokens ¥60.00

moonshot-v1-vision-preview 的应用场景

  • 内容审核与分类:适用于电商商品管理、科研教育中的动植物识别以及平台内容审核。
  • 文档与数据处理:可用于合同、发票等文档的文字提取,以及成绩表、财务报表的数据分析。
  • 医学与工业应用:辅助医学影像分析,提升诊断准确性;用于工业产品缺陷检测。
  • 智能交互服务:在客服、教育和智能家居等领域提供更智能的多模态交互体验。
  • 美学与设计评估:从美学角度分析图像,为广告、网页设计提供优化建议。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部