目录
书名 | 出版日期 | 实验环境 | 简要评价 |
---|---|---|---|
《数字图像处理(MATLAB版)(第2版)》 | 2015.1 | MATLAB 2014b | 理论+实践 |
《MATLAB计算机视觉与深度学习实战》 | 2017.6 | MATLAB | 30个项目实例 |
《实用MATLAB图像和视频处理》 | 2013(英文2011) | MATLAB | 章毓晋翻译 |
《数字图像处理(MATLAB版)(第2版)》
CH1 数字图像的相关论述
数字图像的表示:二维矩阵
像素的属性
- 位置(行列坐标值)
- 灰度值(光学亮度值)
数字图像处理的内容
- 图像获取和输出
- 图像编码和压缩
- 图像增强和复原
- 图像变换
- 图像分割
- 图像信息安全
- 图像的识别与检测
数字图像处理的方法
- 空域处理法(空间域):领域处理法、点处理法
- 变换域处理法(傅里叶变换、小波变换…)
图像数字化技术
图像 —采样、量化—> 矩阵图像的统计特征
- 统计量:信息量(熵)、灰度平均值、灰度众数、灰度中值、灰度方差、灰度值域
- 直方图
- 统计特性:协方差、相关系数
CH2 数字图像处理的数学基础及运算
点运算
点运算的结果由灰度变换函数(gray-scale transformation,GST)确定,即:B(x,y)=ƒ[A(x,y)]
- 线性点运算:调整灰度值(+)、对比度(*)
- 分段线性点运算:细节灰度拉伸、对比度增强
- 非线性点运算:由于成像设备本身的非线性失衡需要对其极端校正
- 直方图均衡化=直方图平坦化:增强图像整体对比度
- 直方图规定化=直方图匹配:转换为具有特定直方图的图像
代数运算
- 加法运算:①消除加性噪声②图像叠加
- 减法运算=差分运算:消除图像背景,以突出目标
- 乘法运算:图像掩膜操作
- 除法运算:①消除光影影响,对图像进行归一化②产生比率图像,以检测变化
- 求补运算
区域运算
只对图像中某个区域进行处理
- 指定感兴趣区域:通过二值掩膜实现
- 图像的领域操作:滑动领域操作、分离领域操作=块操作
- 特定区域填充
CH3 图像编码
图像压缩:利用图像数据固有的冗余性和相关性,将大的图像数据文件转换成较小的同性质的文件。
编码系统研究的问题:编码平均长度R减小,编码效率趋近1,冗余度趋于0
熵编码
统计编码,在消息和码字之间找到明确的一一对应/极相似对应关系。
赫夫曼编码
基于统计的无损编码。算数编码
把整个信源表示为实数线上的0到1之间的一个区间,其长度等于该序列的概率。再在该区间内选择一个代表性的小数,转化为二进制作为实际的编码输出。行程编码
利用空间冗余度压缩,针对二值图像效果显著。
预测编码
主要目的是降低图像原始空间域表示中存在的非常强的相关性。(空域方法)
- 最佳线性预测编码:均方误差最小准则
变换编码
主要目的是降低图像原始空间域表示中存在的非常强的相关性。(变换域方法)
变换具有将图像能量或信息集中于某些系数的能力。
基于FFT的图像压缩技术(快速傅里叶变换)
基于DCT的图像压缩技术(离散余弦变换)
基于DWHT的图像压缩技术(哈达玛变换)
CH4 图像复原
图像退化的模型
g(x,y) = H[f(x,y)] + n(x,y)
H为退化过程的算子,f(x,y)为原始图像,n(x,y)为加性噪声,g(x,y)为退化图像。
两点建议:
- 尽可能从物理原理上估准图像的点扩展函数。
- 尽可能尝试多种方法。
CH5 图像几何变换
几何(畸变)校正分两步:
- 实现空间变换(位置)
- 灰度级的插值(灰度)
几何校正的基本关系式
几何变换
后验校正法的思想:通过一些已知的正确像素点和畸变点间的对应关系,拟合出多项式的系数。即用多项式近似,求h1(x,y)、h2(x,y)
①线性变换
3个点 => 6个等式 => 6个变量
②二次型畸变
6个点 => 矩阵形式,不一定有解,用最小二乘法
几何变换后的3种情况:
情况 | 处理 |
---|---|
坐标落在畸变图像的像素上 | 原图像(x,y)点的灰度值=畸变图像相应点(x’,y’)的灰度值 |
坐标落在畸变图像内而不是像素点 | 用内插值得到灰度级 |
坐标落在畸变图像外 | 用最靠近它的像素点的灰度值 |
内插法确定像素的灰度值
- 最近邻法(取1个点)
- 双线性内插法(取4个点)
- 三次卷积法(取16个点)
齐次坐标
以n+1维向量表示n维向量,对各种几何变换进行统一表示
几何意义:点(x,y)投影在xyz三维立体空间的z=1的平面上
CH6 图像频率变换
CH7 小波变换
性质随实践是稳定不变的信号:傅里叶分析
性质随实践是非稳定的信号:小波分析
CH8 图像增强
图像增强与图像复原:
- 图像增强是主管改善的过程。不考虑图像噪声的原因
- 图像复原以客观情况为基准。针对图像噪声产生的原因。
注意:图像增强算法并不能增加原始图像的信息,而是通过某种技术手段有选择地突出对某一具体应用有价值的信息。如图像噪声的消除是以纹理信息(高频信息)的减弱为代价而实现的。
领域运算=领域与模板的卷积
CH9 图像分割与边缘检测
图像分割:将一幅图像划分为互不重叠的、有意义的、具有相同性质的区域。其中一个对应于背景,其他对应于图像中的各个物体。
分割算法基于图像在像素级的两个性质:不连续性、相似性
- 属于同一目标的区域一般具有相似性
- 不同的区域在边界表现出不连续性
边缘检测
边缘检测的基本内容:
- 抽取出反映灰度变化的边缘点
- 剔除某些边界点或填补边界间断点,并将边缘连接成完整的线
边缘检测的总体思路:
边缘 → 灰度变化显著 → 函数导数大 → 一阶导数的局部极大值/二阶导数的过零点
将导数值作为相应点的边界强度,通过设置门限的方法(看灰度直方图的分布,寻找其分界的地方为临界值),提取边界点集
各种算子的来源:
微商思想、平滑思想、准则函数确定边界提取器思想等基本技术的不同“组合”产生了不同边界提取算法。
边缘检测算子比较
算子 | 简述 | 优点(适用范围) | 缺点 |
---|---|---|---|
Roberts算子 | 利用局部差分算子寻找边缘 | 对具有陡峭边缘且噪声低的图像效果好 | 容易丢失一部分边缘、不具备抑制噪声的能力 |
Sobel算子、Prewitt算子 | 先做加权平滑处理,再做微分运算 | 边缘定位效果不错,对噪声有一定抑制能力 | 检测的边缘容易出现多像素宽度、出现虚假边缘 |
Laplacian算子 | 不依赖于边缘方向的二阶微分算子 | 对阶跃型边缘点定位准确、对噪声非常敏感 | 容易造成不连续的检测边缘、抗噪声能力差 |
LOG算子 | 克服Laplacian算子抗噪声能力差的缺点 | 有一定抗噪声能力 | 尖锐边缘无法检测到 |
Canny算子 | 采用高斯函数做平滑处理,采用双阈值算法检测和连接边缘 | 多尺度检测和方向性搜索比LOG算子好 | 平滑掉高频边缘,可能造成边缘丢失 |
阈值分割
图像分割可以理解为将图像中有意义的特征区域提取出来。特征区域可以是像素的灰度值、物体轮廓曲线、纹理特征等,也可以是空间频谱或直方图特征等。
阈值分割:通过设定不同的特征阈值,把图像像素点分为若干类。
基于假设:目标或背景内的相邻像素间的灰度值是相似的,但不同目标或背景的像素在灰度上有差异。(反映在直方图上,两峰之间有谷)
阈值分割方法 | 简述 |
---|---|
灰度阈值法 | 常用方法:利用灰度直方图求双峰或多峰,选择两峰之间谷底出的灰度值作为阈值 |
Otsu法 | 使类间方差最大的自动阈值的方法(最小二乘法,统计意义上的最佳分割) |
迭代式阈值分割法 | 开始时选择一个阈值作为初始估计值,然后按某种策略不断改进估计值,知道满意给定的准则为止 |
分水岭算法 | 在图像中找出不同的吸水盆地和分水岭,要分割的目标即吸水盆地和分水岭组成的区域(灰度值对应地形高度值) |
边界跟踪
边界跟踪:获得的边缘点有可能是不连续的 → 有意义的边缘信息
处理对象:①直接在原图像上进行②在边缘检测得到的梯度图上进行
步骤:
- 确定边界的起始搜索点
- 确定合适的边界判别准则(是不是边缘点)和搜索准则(搜索下一个边缘点,如4-连通)
- 确定搜索的终止条件
Hough变换:将边缘像素连接起来得到边界曲线
优点:受噪声和曲线间断的影响较小
可看成:聚类分析技术
原理:利用图像空间与参数空间的对应关系,将图像空间的检测问题转化到参数空间,通过在参数空间进行简单的累加统计来完成检测任务。
区域分割
- 之前的:像素值的差别
- 区域生长法:寻找具有相似性的像素群
区域增长的基本思想:将具有相似性质的像素集合起来构成区域。
具体操作:
- 对每个需要分割的区域找一个种子像素,作为增长的起始点。
- 将种子像素周期邻域中与种子像素有相同或相似性质的像素合并到种子像素所在的区域。(相似性准则:灰度级、彩色、组织、梯度、其他特性)
- 将这些新像素当作新的种子像素继续进行上面的过程,直到再没有满足条件的像素。
运动分割
运动目标分割的研究对象:图像序列
CH10 图像特征描述
PS
MATLAB程序自带的图片的目录:C:\Program Files\MATLAB\R2016a\toolbox\images\imdata\saturn.png