Canny边缘检测算法的原理和实现

Posted on 2024-06-21 In Coding

简介

本文简单介绍了canny边缘识别算法的原理和c++实现

原理解析

Canny算法主要由四个步骤组成

消除噪声
计算梯度和大小
利用梯度和大小去除非极大值
连接边缘

前置操作 - 图像灰度化

由于边缘检测只需要关心图像边缘，图像色彩不会造成影响。并且，储存灰度值只需要一个字节，这样子可以大大加速计算过程和节约内存空间。

所以在进行canny算法的实现之前，我们首先需要对图像进行灰度化操作。

常见的图像灰度化如下。

取rgb通道中任意一个通道的值作为灰度值
取rgb通道中最大的一个通道的值作为灰度值
对rgb通道取平均值
用人眼对三原色的敏感度，对三个通道做加权平均得到灰度值

在参考资料后，选择4作为灰度方法。

即

1	float grey = 0.114 * blue + 0.587 * green + 0.299 * red

这个计算在整型的计算方法如下

const uint32_t B_coef = 30;   // 0.114 * 256
const uint32_t G_coef = 150;  // 0.587 * 256
const uint32_t R_coef = 77;   // 0.299 * 256

uint8_t grey = (uint8_t) ((blue * B_coef + green * G_coef + red * R_coef) >> 8);

asdf

高斯消除噪声 (Gaussian Filter)

在进行边缘检测之前，我们需要对图像进行平滑处理，以便减少图像中的噪声。噪声会导致边缘检测算法误检边缘，因此消除噪声是非常重要的一步。在Canny算法中，通常使用高斯模糊来平滑图像。

高斯模糊的原理是将每个像素的值与其周围像素的值进行加权平均，加权系数由高斯函数确定。具体公式如下：

二维高斯函数

通过二维高斯函数，我们就能够确定权重矩阵了。

计算方法：首先用高斯函数计算出每个点的值，然后做归一化处理，得到最后的权重矩阵。

asdf

权重矩阵近似值

利用这个权重矩阵，对每个像素进行处理，就能得到高斯模糊后的图片了。

比如，一个像素点和他周围的值为

1
2
3

32 32 32
32 32 32
32 32 32

在经过运算后，中间的像素值就是

1	32 * 4 / 16 + 4 * 32 * 2 /16 + 4 * 32 * 1 / 16 = 32

为什么需要先做高斯平滑

为什么消除噪声非常重要，如果我们不对图像做平滑处理，图像的信号就会如下所示。在这个时候直接计算derivative，会因为每个连续的点之间不够平滑，无法很好的得到一个first derivative signal，这就导致无法很好的通过first derivative判断边缘的位置

credit: UBC CPSC427 @ Leonid Sigal

在经过高斯后，我们可以发现信号就很平滑了，边缘的位置也比较好判断

credit: UBC CPSC427 @ Leonid Sigal

计算梯度大小和方向 (Gradient Calculation)

边缘通常位于图像中灰度值变化较大的区域，因此我们需要计算图像中每个像素点的梯度。

由于2d图直接算比较复杂，且消耗运算量，我们可以分别计算图像在水平方向(x轴)和垂直方向(y轴)上的梯度。最后在通过公式计算出方向和大小。

梯度大小可以通过绝对值相加的方式计算（减少运算量）

1	magnitude = abs(dx) + abs(dy)

梯度方向可以通过arctan计算

1	direction = arctan(dy/dx)

通过合并计算梯度与高斯平滑加速运算

通过预先计算高斯平滑的导数，我们可以合并高斯平滑和导数计算。事先计算好高斯平滑的导数，在用这个函数与图像在傅立叶空间中相乘，直接得到高斯平滑后的导数。

credit: UBC CPSC427 @ Leonid Sigal

利用梯度大小和方向去除非极大值 (Non Maximum Suppression)

在计算出图像中每个像素点的梯度大小后，我们需要对其进行非极大值抑制。非极大值抑制的目的是去除那些不在边缘上的像素点，使得最终的边缘结果更加细致。

非极大值抑制的原理是：对每个像素点，根据其梯度方向，检查其在梯度方向上的两个邻近像素点的梯度大小。如果当前像素点的梯度大小不是最大的，则将其梯度值置为0。

source: https://docs.opencv.org/3.4/da/d22/tutorial_py_canny.html

在canny算法中，梯度方向被分为了0°, 45°, 90°, 135° 四个方向，即水平，垂直，两个斜45°方向。

nms_direction

在具体实现中，我们可以使用tan函数先计算不同角度下dy/dx的值，然后通过dy/dx的比值来判断属于哪个方向。

const uint32_t tan225 = 27145; // 22.5° math.tan(math.pi/8) * (2**16)
const uint32_t tan675 = 158217; // 67.5° math.tan(math.pi/8*3) * (2**16) 
uint32_t tanxy;
if (gx != 0) {
    tanxy = (static_cast<uint32_t>(abs(gy)) << 16) / abs(gx);
} else {
    tanxy = UINT32_MAX;
}
if (tanxy < tan225) {
// 小于22.5° => 0°方向
}else if (tanxy > tan675) {
// 大于67.5° => 90°方向
}else if (gy*gx > 0) {
// dx,dy方向相同，45°方向
}else {
// dx,dy方向相反，135°方向
}

asdf

双阈值检测 (Double Threshold)

双阈值检测的目的是将梯度值较大的边缘标记为强边缘，将梯度值较小但仍可能是边缘的像素标记为弱边缘。

通过设定两个阈值: 高阈值(k_high), 和低阈值(k_low)，我们可以将图像中的像素分类为强边缘 (A)、弱边缘(B, C) 和非边缘。

source: https://docs.opencv.org/3.4/da/d22/tutorial_py_canny.html

一般来说，高阀值设置为低阀值的两倍

credit: UBC CPSC427 @ Leonid Sigal

在具体实现中，把高于maxVal的像素点直接设置为255，把低于minVal的点直接设置为0，弱边缘的值保持不变。

if (src.at<uchar>(row, col) < low_threshold) {
    dst.at<uchar>(row, col) = 0;
}else if (src.at<uchar>(row, col) > high_threshold) {
    dst.at<uchar>(row, col) = 255;
}else {
    dst.at<uchar>(row, col) = src.at<uchar>(row, col);
}