什么是图像分类?图像分类的单标签分类和多标签分类概念

发布:2022-12-01 16:21:53
阅读:8750
作者:网络整理
分享:复制链接

什么是图像分类?

图像分类是将一个(单标签分类)或多个(多标签分类)标签与给定图像相关联的任务。图像分类是计算机视觉领域的基础任务。本文让我们根据分类任务的复杂性简要讨论两种类型的图像分类。

什么是图像分类?图像分类的单标签分类和多标签分类概念

图像分类的两种类型

单标签分类

单标签分类是监督图像分类中最常见的分类任务。

顾名思义,在单标签分类中,每个图像都有一个标签或注释。因此,该模型为它看到的每个图像输出单个值或预测。

模型的输出是一个向量,其长度等于类别的数量,值表示图像属于此类的分数。

使用Softmax激活函数来确保分数总和为1,并采用分数的最大值来形成模型的输出。

单标签分类数据集的一些示例包括MNIST、SVHN、ImageNet等。

单标签分类可以是多分类类型,即可以有两个以上的类或二元分类,其中类的数量限制为两个。

多标签分类

多标签分类是一种分类任务,其中每个图像可以包含多个标签,并且某些图像可以同时包含所有标签。

虽然这在某些方面看起来类似于单标签分类,但与单标签分类相比,问题陈述更为复杂。

多标签分类任务普遍存在于医学成像领域,在该领域,患者可以通过X射线形式的视觉数据诊断出不止一种疾病。

此外,在自然环境中图像标记也可以被定义为多标签分类问题,指示图像中存在的对象。

扫码进群
微信群
免费体验AI服务