计算机视觉系列-图像基本操作(6)

  • 2021 年 1 月 29 日
  • AI
  • 灰度图

      在数字摄影、计算机生成的图像和色度学中,灰度或图像是指每个像素的值是一个仅代表一个度量的样本,只携带强度信息。灰度图像是一种黑白或灰色单色图像,只由灰度的阴影组成。对比度范围从强度最弱的黑色到强度最强的白色。

Python">import cv2 #opencv读取的格式是BGRimport numpy as np import matplotlib.pyplot as plt#Matplotlib是RGB%matplotlib inline 
img=cv2.imread('cat.jpg')img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)img_gray.shape

opencv读取图片的默认像素排列是BGR

cv2.imshow("img_gray", img_gray)cv2.waitKey(0)    cv2.destroyAllWindows()

运行结果如下:

  • HSV

H – 色调(主波长)。

S – 饱和度(纯度/颜色的阴影)。

V值(强度)

    HSL(hue,saturation,lightness)和HSV(hue,saturation,value,也称为HSB或hue,saturation,brightness)是RGB颜色模型的替代表示形式,由计算机图形学研究人员在20世纪70年代设计,旨在更紧密地与人类视觉感知颜色属性的方式保持一致。在这些模型中,每个色调的颜色都排列在一个径向切片中,围绕中心轴从底部的黑色到顶部的白色。

hsv=cv2.cvtColor(img,cv2.COLOR_BGR2HSV)
cv2.imshow("hsv", hsv)cv2.waitKey(0) cv2.destroyAllWindows()

运行结果如下:

  • 图像阈值

ret, dst = cv2.threshold(src, thresh, maxval, type) 

src:输入图,只能输入单通道图像,通常来说为灰度图

dst:输出图

thresh:阈值

maxval:当像素值超过了阈值(或者小于阈值,根据type来决定),所赋予的值

type:二值化操作的类型,包含以下5种类型:cv2.THRESH_BINARY;cv2.THRESH_BINARY_INV;cv2.THRESH_TRUNC;cv2.THRESH_TOZERO;cv2.THRESH_TOZERO_INV

cv2.THRESH_BINARY 超过阈值部分取maxval(最大值),否则取0

cv2.THRESH_BINARY_INV THRESH_BINARY的反转

cv2.THRESH_TRUNC 大于阈值部分设为阈值,否则不变

cv2.THRESH_TOZERO 大于阈值部分不改变,否则设为0

cv2.THRESH_TOZERO_INV THRESH_TOZERO的反转

Javascript">ret, thresh1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)ret, thresh2 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY_INV)ret, thresh3 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TRUNC)ret, thresh4 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO)ret, thresh5 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_TOZERO_INV)
titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]
for i in range(6): plt.subplot(2, 3, i + 1), plt.imshow(images[i], 'gray') plt.title(titles[i]) plt.xticks([]), plt.yticks([])plt.show()

运行结果如下:

 

  • 图像平滑

图像平滑通常用于减少图像中的噪声或生成像素较少的图像。大多数平滑方法都基于低通滤波器。平滑通常也基于表示图像的单个值,例如图像的平均值或中间值。

img = cv2.imread('lenaNoise.png')
cv2.imshow('img', img)cv2.waitKey(0)cv2.destroyAllWindows()

运行结果如下:

# 均值滤波# 简单的平均卷积操作blur = cv2.blur(img, (3, 3))
cv2.imshow('blur', blur)cv2.waitKey(0)cv2.destroyAllWindows()

运行结果:

# 方框滤波# 基本和均值一样,可以选择归一化box = cv2.boxFilter(img,-1,(3,3), normalize=True)  
cv2.imshow('box', box)cv2.waitKey(0)cv2.destroyAllWindows()

运行结果:

# 方框滤波# 基本和均值一样,可以选择归一化,容易越界box = cv2.boxFilter(img,-1,(3,3), normalize=False)  
cv2.imshow('box', box)cv2.waitKey(0)cv2.destroyAllWindows()

运行结果如下:

# 高斯滤波# 高斯模糊的卷积核里的数值是满足高斯分布,相当于更重视中间的aussian = cv2.GaussianBlur(img, (5, 5), 1)  
cv2.imshow('aussian', aussian)cv2.waitKey(0)cv2.destroyAllWindows()

运行结果如下:

# 中值滤波# 相当于用中值代替median = cv2.medianBlur(img, 5)  # 中值滤波
cv2.imshow('median', median)cv2.waitKey(0)cv2.destroyAllWindows()

运行结果如下:

# 展示所有的res = np.hstack((blur,aussian,median))#print (res)cv2.imshow('median vs average', res)cv2.waitKey(0)cv2.destroyAllWindows()

运行结果如下: