定位

Diffree

一款通过AI技术可根据文本描述智能地向图像中添加新对象,Diffree让你只需一句话就可以为您的图片添加新元素,不需要复杂的操作就可以体验简单高效的图像编辑工具。

PDF阅读助手

PDF阅读助手是腾讯混元大模型支持,QQ浏览器推出的PDF智能工具,主要功能包括智能摘要、智能问答、多轮提问和原文定位等。由腾讯混元大模型支持,可以在手机或电脑上随时使用。

Tarsier

字节跳动推出的一系列大规模视觉语言模型(LVLM),专注于视频理解任务,包括视频描述、问答、视频定位、幻觉测试等功能。

YOLO

腾讯AI实验室开发的一个实时目标检测工具,它能够自动识别和定位图像中的各种对象

Uten.Shop

TikTok官方指定的全球首家直播电商数据分析平台,Uten.Shop专注于为TikTok上的红人及商家提供精准的数据分析服务,旨在提升直播带货效率和营销效果。

PiPiADS

一个专注于TikTok 和 Facebook平台的广告情报工具,PiPiADS帮助用户发现热门商品和具有高转化率的广告活动。

万媒易发

让您轻松实现自媒体内容同步、营销、分发。支持跨平台多账号管理,一键同步发布文章,解放双手,释放生产力,是内容运营必备的一文多发工具。

36氪

提供创业资讯、科技新闻、投融资对接、股权投资、极速融资等创业服务

DeepEyes

DeepEyes是由小红书团队和西安交通大学联合开发的多模态深度思考模型,基于端到端强化学习实现“用图思考”能力,无需依赖监督微调。它在推理过程中动态调用图像工具,增强对细节的感知与理解,在视觉推理基准测试V* Bench上准确率高达90.1%。具备图像定位、幻觉缓解、多模态推理和动态工具调用等功能,适用于教育、医疗、交通、安防和工业等多个领域。

MCA

MCA-Ctrl是由中科院计算所与国科大联合开发的图像定制生成框架,通过引入SAGI和SALQ注意力控制策略及主体定位模块,提升图像生成质量与一致性。支持零样本图像生成,适用于主体特征保持、背景一致性维护等多种任务,广泛应用于数字内容创作、广告设计、艺术创作等领域。