python计算机视觉深度学习工具2图像基础

本文教程目录

构建自己的图像分类器之前需要了解图像是什么。

像素:图像的元素

像素是图像的基本元素。每个图像都由一组像素组成。没有比像素更细的粒度。

通常像素是光的“颜色”或“强度”。

下图的分辨率为1,000×750,这意味着它是1,000像素宽750像素高。我们可以将图像概念化为(多维)矩阵。图片中总共有1,000×750 = 750,000像素。

image.png

大多数像素以两种方式表示: 1.灰度/单通道 2.颜色

在灰度图像中,每个像素是0到255之间的标量值,其中零对应为“黑色”,255为“白色”。 image.png

彩色像素通常在RGB颜色空间中表示(其他颜色空间通常要转成RGB)。

image.png

黑色:(0, 0, 0) 红色:(255, 0, 0)

RGB色彩空间的主要缺点包括: •不使用“颜色选择器”工具时表示颜色不直观 •它不像人类看待颜色的方式。

image.png

image.png

图像坐标系统

OpenCV和scikit-image用多维NumPy数组表示RGB。

image.png

import cv2
image = cv2.imread("example.png")
print(image.shape)
cv2.imshow("Image", image)
cv2.waitKey(0)

执行结果:

$ python load_display.py
(248, 300, 3)

像素访问

(b, g, r) = image[20, 100] # accesses pixel at x=100, y=20
(b, g, r) = image[75, 25] # accesses pixel at x=25, y=75
(b, g, r) = image[90, 85] # accesses pixel at x=85, y=90

OpenCV的存储顺序:Blue, Green, Red

  • 技术支持qq群144081101 591302926 567351477 钉钉免费群:21745728

缩放

image.png

多数神经网络和卷积神经网络应用于图像任务分类要求固定大小的输入,意味着你通过的所有图像的尺寸必须相同。输入的宽度和高度图像尺寸的常见选择卷积神经网络包括32×32,64×64,224×224,227×227,256×256和299×299。

image.png

参考资料

links