什么是图像分类?
图像分类的核心任务是从预定义的一类图像中为图像分配标签。分析输入图像并返回标签对图像进行分类。标签始终来自一组预定义的可能类别。
比如预定义的标签为:
categories = {cat, dog, panda}
分类系统还可以通过概率为图像分配多个标签。比如狗:95%;猫:4%;熊猫:1%。更重要的是,W×H像素输入图像有三个通道,Red,Green和Blue,分析W×H×3 = N像素图像,并弄清楚如何正确分类图像的内容。
在图像分类中,我们的数据集是图像的集合。因此,每个图像都是数据点。
左边猫,右边狗,电脑看到的是像素矩阵。实际上,计算机并不知道图像中有动物。
上图可描述如下: •空间:天空位于图像的顶部,沙/海洋位于底部。 •颜色:天空是深蓝色,海水浅蓝色,而沙子则是 棕褐色。 •纹理:天空具有相对均匀的图案,而沙子非常粗糙。
需要应用特征提取来量化图像的内容 …
read more