DIP

DIP复习记录

冈萨雷斯数字图像处理

Posted by Wngzh on December 3, 2018

数字图像处理的基本步骤&主要应用

数值图像处理的主要内容/基本步骤

  1. 图像数字化
  2. 图像变换
  3. 图像增强
  4. 图像复原与重建
  5. 图像编码
  6. 图像分割
  7. 二值图像处理与形状分析
  8. 纹理分析
  9. 图像识别

根据成像信息源的数字图像处理主要应用(不同波段的成像特点及应用)

gamma:核医学和天文观测,PET %能量高,穿透性好

X-Ray:医学诊断、工业和其他领域(天文学) %能量高,穿透性好

紫外光:平板印刷、工业检测、显微、激光、天文成像 %适用于激发荧光

可见光和红外成像:显微、天文、遥感、工业 %光谱特征能够反映不同的特征,能够被人类分辨提取信息,红外光能够反映热量信息

微波:雷达 %无视天气条件的成像,可以穿过云层

无线电波成像:MRI核磁共振、天文 %绕射、穿透

声波:B超(超声),声呐,地质勘探(次声)%电磁波无法探测的地方

电子:SEM扫描电镜、TEM透射电镜%成像分辨率高

计算机:分形

灰度变换与空间滤波

空间与滤波与频率域滤波的特点以及常用的滤波器

空间域滤波是对像素直接做操作,而频率域滤波是对图像的傅里叶变换(DCT、小波)进行操作。 常用的滤波器有

1.线性滤波器。低通、高通、带通滤波器

2.非线性滤波器。最大值、最小值、中值

3.按照处理效果分类,可以分为平滑和锐化滤波。(低通、高通对应了平滑效果和锐化效果)

4.(算数)均值滤波、加权均值滤波、中值滤波–统计排序滤波

空间域处理的方式是掩模和图像的卷积

对于一个3x3的掩模

R=w1z1+…+w9z9

w是掩模系数,z是对应的图像灰度值,运算结果存储在z5对应的像素中,需要新的图像矩阵,不能进行同址运算。

掩模处理的边界处理

1.图像边缘补0(常数)

2.边缘像素复制 范围(m-1)/2

常数填充对于原图像的影响会随着掩模的变大而变大,一般边缘像素复制更好

基本的灰度变换函数 翻转对数幂次 变化特点应用场合

1.图像翻转

s=L-1-r [0,L-1]

负色

增强图像暗色区域的白色或灰色细节

2.对数变化

s=clog(1+r) 扩展低输入,压缩高输入

动态范围大,超出显示范围—-傅里叶频谱

3.幂次变换

s=cr^\gamma 拉伸或压缩

伽马校正:图像获取和打印装置往往是按照幂次响应,要进行修正 CRT

4.分段线性变换

-对比度拉伸:压缩两段动态范围,扩展中段动态范围

-灰度切分 突出目标轮廓 消除/保留背景细节

灰度直方图 应用

某种灰度级的像素个数–仅由像素出现概率,没有位置信息;图像有唯一直方图,多对一;子区直方图之和是全区直方图

1.评价成像条件,是否合理使用了灰度动态范围

2.根据直方图设计灰度映射函数进行图像增强

3.图像分割 根据灰度直方图,将像素分割成不同的类别,实现对不同景物的提取

4.图像压缩 像素出现概率和Huffman编码

灰度直方图获得的图像信息

图像总体性质

-明暗程度

-动态范围

-细节清晰?灰度分布均匀则细节清晰

直方图均衡化

s=T(r),r–[0,255]

。。。

中值滤波

将掩模内的中位数代替该像素的值,处理椒盐噪声效果较好

频率域滤波

微分算子

一阶二阶微分与一阶二阶微分算子–锐化空间滤波器

一阶微分 f’=f(x+1)-f(x)

二阶微分 f’‘=f(x+1)+f(x-1)-2f(x)

频率域滤波

  1. 对MxN的图像补零,称为一个2Mx2N的矩阵,避免缠绕(卷积后向临周期的交叠)
  2. (-1)^(x+y)做平移变换
  3. 计算DFT
  4. 使用中心在P/2,Q/2的大小是PxQ的实函数H(u,v)做滤波G(u,v)=H(u,v)F(u,v)
  5. 做反变换取实部再*(-1)^(x+y)
  6. 左上提取MxN作为结果

H的生成可以按照1、2、3两步实现(h)

同态滤波

消除照度不均的影响,增强图像细节

反射分量主要在高频,变化快,照射分量在低频,变化慢,反射分量反应图像的内容

  1. z(x,y)=ln f(x,y)=ln i(x,y)+ln r(x,y)
  2. F[z(x,y)]=F[ln i(x,y)]+F[ln r(x,y)]
  3. Z(u,v)=Fi[u,v]+Fr(u,v)
  4. 压缩i(x,y),提升r(x,y),减少低频增加高频
  5. f->ln->DFT->H->IDFT->exp

S(u,v)=H(u,v)Fi(u,v)+H(u,v)Fr(u,v)

图像复原与重建

空间域和频率域的图像退化数学模型和造成退化的原因

成像系统受到各种因素的影响,在获取和传输过程中使图像质量降低的现象,例如,成像系统散焦、成像设备与物体之间的相对运动,外界环境的干扰和噪声

  1. 获取过程 光学系统的像差、衍射、非线性畸变、散焦、光学元件的非线性、成像过程的相对移动、大气湍流效应、环境随机噪声
  2. 传输过程 传输信道干扰

h是退化函数,n是噪声

空间:g(x,y)=h(x,y)★f(x,y)+n(x,y)

频率:G(u,v)=H(u,v)F(u,v)+N(u,v)

图象复原又称反卷积、去卷积在已有h和n的先验知识条件下去估计f

均值滤波、统计排序滤波

  1. 算数均值滤波 1/nm Sigma(g(x,y))
  2. 几何均值滤波–会扩大黑点,因为0xN=0,相对于算数均值,能够保留更多细节– (Pi(g(x,y)))^(1/nm)

前两者适合处理高斯或均匀噪声

  1. 谐波均值滤波–盐粒噪声、高斯噪声 mn/(sigma(1/g(x,y)))
  2. 逆谐波均值滤波–Q<0盐粒噪声Q>0胡椒噪声..Q=0算数均值,Q=-1谐波均值滤波器 $\Sigma(g(x,y)^{Q+1})/\Sigma(g(x,y)^Q)$
  3. 统计排序滤波 中值滤波、最大值滤波、最小值滤波、中点滤波(max+min)/2

    –修正的alpha中值滤波–

    f=1/(mn-d) sigma(gr(x,y)) –gr表示去掉了最高和最低的d/2个灰度值,d=0是均值滤波,d=mn-1(最大值)是中值滤波

自适应滤波

\[f(x,y)=g(x,y)-\frac {\sigma_{\eta}^2}{\sigma_{L}^2}[g(x,y)-m_L]\]

${\sigma_{\eta}^2}$是全局噪声方差,${\sigma_{L}^2},m_L$是局部参数

-在二者相差较大的时候表示是边缘部分应该予以保护减少平均,二者相差较小的时候表示应当予以平均去噪 -这样就有一个假设,假设局部方差是大于全局方差的,如果不满足,1,可以把系数直接置1,2,可以将负灰度重新标定

因为考虑了图像的局部特征与全局特征之间的关系,所以效果比较好,但是复杂度较高

自适应中值滤波

A//检查zmed是不是脉冲

  1. $A_1=z_{med}-z_{min},A_2=z_{med}-z_{max}$
  2. IF $A_1>0 且 A_2<0$ JMP TO B
  3. ELSE 增大窗口
  4. IF 窗口 $<=S_{max}$ Repeat A
  5. ELSE output $z_{med}$

B//检查zxy是不是脉冲

  1. $B_1=z_{xy}-z{min},B_2=z_{xy}-z_{max}$

  2. IF $B_1>0 且 B_2<0$,output $z_{xy}$
  3. ELSE output $z_{med}$

周期噪声、带阻和陷波/最佳陷波

纸上

图像退化函数的估计

观察估计

选取高SNR的区域,根据子图像构建一幅估计的认为无噪声的图像,

$g(x,y)$是原图像,$\hat f(x,y)$是估计图像, \(H(u,v)=\frac {G(u,v)}{\hat F(u,v)}\)

假设系统不同区域的性质相同,空间位移不变,可以得到全空间H具有估计H相同的形状

实验估计

对一个脉冲成像,获得 \(H(u,v)=\frac {G(u,v)} A, A=F[\delta (x,y)]=\frac 1 {MN}\)

模型估计

先验物理知识估计,长曝光下的大气湍流 \(H(u,v)=e^{-k(u^2+v^2)^{5/6}}\)

实例:照相机与景物相对匀速直线运动的估计 快门时间$T$,位移分量 \(x_0(t)=\frac {at} T,y_0(t)=\frac {at} T\) \(g(x,y)=\int_0^Tf(x-x_0,y-y_0)dt\) \(G(u,v)=F(u,v)H(u,v)\) \(H(u,v)=\int_0^Te^{-j2\pi (ux_0+vy_0)}dt\) \(H(u,v)=\frac T {\pi(ua+vb)}sin[\pi(ua+vb)]e^{-j\pi(ua+vb)}\)

根据H复原图像

逆滤波、最小均方误差(维纳滤波)、约束最小二乘滤波

彩色图像处理

图像的彩色模型、RGB\CMYK\HSI含义与应用

彩色模型,又称为彩色空间或者彩色系统,在某些标准下用通常可以接受的方式方便地对彩色加以说明。

面向硬件的有RGB/CMYK;面向应用的是HSI彩色模型

RGB彩色模型

24bit表示一个像素的位数,RGB各自8bit,使用一个彩色立方体笛卡尔三维坐标系表示RGB三种颜色分量原点处是黑色,(1,1,1)是白色;RGB常被用于彩色监视器和一大类彩色摄像机。

CMY彩色模型

C=1-R 青

M=1-G 品红

Y=1-B 黄

以上三种是颜料的原色,光的二次色,

Y—-黑色

等量的颜料原色是不纯的黑色,需要专门的黑色

CMY–>CMYK

K=min{C,M,Y}

C=C-K

M=M-K

Y=Y-K

对于打印机、复印机这种在纸上沉积颜料的设备适用

HSI彩色模型

反映了人眼观察色彩的方式

H-色调,S-饱和度,I-强度

图像处理算法使用、选色器

伪彩色处理

把真实彩色图像或遥感多光谱图像用伪彩色表示,将不同颜色人为分配到单色图像上

  1. 映射成奇异彩色,引人注目
  2. 适应人眼对彩色的灵敏度,提高鉴别力
  3. 遥感多光谱:获得更多信息

处理方法:

  1. 灰度分层,将灰度值分为几个灰度级,将不同的灰度级赋值不同的颜色
  2. 灰度变换,

    R=TR[f(x,y)]

    G=TG[f(x,y)]

    B=TB[f(x,y)]

HSI模型适用于图像处理

使用色调、饱和度、亮度来描述,对人来说自然直观。色调表示的是纯色的颜色属性,饱和度表示的被白光稀释的程度度量,亮度表示了无色的强度概念

HSI模型描述

H:颜色点和强度轴的连线与红色之间的夹角,反映了接近红光的程度

S:饱和度,色环原点到颜色点的半径长度,中间是灰色,0饱和度,圆周是饱和1的颜色

I:亮度,不管颜色是什么

\[I=\frac 1 3 (R+G+B)\] \[S=1-\frac 3 {R+G+B}min(R,G,B)\] \[H=\theta,B\le G\] \[H=360-\theta,B>G\] \[\theta = cos^{-1}[\frac {\frac 1 2 [(R-G)(R-B)]} {\sqrt {(R-G)^2 + (R-B)(R-G)}}]\]

图像压缩

主要的数据冗余

编码冗余:来自实际编码但是未被使用的像素灰度 空间、时间冗余:像素排列是空间相关的,视频的不同帧之间也是相关的 心理视觉冗余:人眼忽略或者与用途无关的—不相关信息

常见的数据压缩格式

JPEG:有损压缩,使用了图像二维分割、DCT变换、量化、熵编码

BMP:使用RLE或者Huffman的压缩方法

TIFF:LZW压缩

PNG:无损压缩格式

HUFFMAN编码

HUFFMAN树构建,对频率进行排序

编码效率 信源熵/平均码长

压缩率$C=b/b’$ 压缩前/压缩后

冗余度$R=1-1/C$

规定C–[0,infty),R–[0,1)

算术编码

信源符号{a,b,c,d}

静态的分割方法

动态改变概率的方法

形态学处理

反射: \(\hat B=\{w|w=-b, b\in B\}\)

位移: \((B)_z=\{w|w=b+z,b\in B\}\)

补集:$A^c$

腐蚀&膨胀

\[A\ominus B=\{z|(B)_z\subseteq A\}\]

消除二值图像的不相关细节,(毛刺、凸起)

\[A\oplus B=\{z|(\hat B)_z\cap A \neq \varnothing \}\]

消除孔洞,连接裂缝

具有对偶性

\[(A\ominus B)^c=A^c\oplus \hat B\] \[(A\oplus B)^c=A^c\ominus \hat B\]

开操作 & 闭操作

开操作 \(A\circ B=(A\ominus B)\oplus B\) 断开狭缝的连接,去除噪点(细小物体),大物体的尺寸基本不变,如果使用圆结构元素,可以光滑表面

  1. $A\circ B$是$A$的子集
  2. $C\subseteq D,C\circ B\subseteq D\circ B$
  3. $A\circ B=(A\circ B)\circ B$

闭操作 \(A\bullet B=(A\oplus B)\ominus B\) 连接狭缝,填充小的孔洞去除噪点,大物体大小基本不变,连接断裂的轮廓线

  1. $A$是$A\bullet B$的子集
  2. $C\subseteq D,C\bullet B\subseteq D\bullet B$
  3. $A\bullet B=(A\bullet B)\bullet B$

对偶

\[(A\bullet B)^c=A^c \circ \hat B\] \[(A\circ B)^c=A^c \bullet \hat B\]

图像分割

图像分割 应用 原理

将图像分割成有意义的不互相交叠的有相似性的区域

航空图像识别,林地、农田、城市/文字识别/细胞识别标定

基于灰度的不同区域之间的不连续性,同一区域内的灰度值相似性

一阶二阶微分对灰度的响应

一阶微分对于灰阶响应比较强,二阶微分会产生双响应

一阶微分响应边缘比较宽

对于二阶微分响应点>线>灰阶

二阶微分对细节响应效果好,增强细节

边缘检测算子

Roberts

局部差分寻找边缘,边缘精度高但是容易丢失边缘。不具备抑制噪声能力而且容易受到噪声影响,适合陡峭边缘低噪声信号

Sobel&Prewitt

做加权与微分运算,对噪声有抑制效果,边缘会出现模糊,sobel轻微一些,容易出现多像素边缘。

lapalce

没有方向性阶跃边缘点定位准确,对噪声敏感,容易造成不连续边缘。

缺点:不能检测方向,易受噪声影响,双响应

优点:各向同性,边缘定位准确(零交叉),判断像素在亮侧还是暗侧

LoG

边缘检测细,抗噪声效果好,各向同性

零阈值的零交叉点检测容易出现闭环

canny

所有边缘都被找到且低错误率

边缘定位尽可能接近真实边缘

边缘单一响应和不响应噪声

Hough变换

根据图像的整体信息或者局部信息选择一个或者多个阈值,从而把该图像分割成目标与背景两类区域

一般的取双峰之间的谷底

自动全局阈值

  1. 取T作为估计
  2. 计算G1:f>T,G2:f<=T
  3. 计算G1,G2灰度均值m1,m2
  4. T=(m1+m2)/2
  5. 迭代2-4直至$\Delta$T<预期