
图像是指可以在人类视觉系统中产生视觉印象的客观对象,包括自然风光,捕获的图片和数学上描述的图形. 图像的元素是什么<描述对象的轮廓和形状等. 非几何元素(描绘对象的颜色,材料等).
什么是数字图像
简单来说,数字图像是可以在计算机上显示和处理的图像. 根据其特征,它们可以分为两类: 一比特图像和矢量圆. 位图通常由数字数组表示,常见格式为BMP,Icho,GlF等. 矢量图形由矢量表示,PNG图形是我们联系最多的图形.
我们可以将图像视为二维函数f(x,y),其中x和y是空间坐标,并且在x-y平面内
任意一对空间坐标(x,y)上的振幅f
在该点称为图像的灰度,亮度或强度. 此时,如果f,
X,y都是非负有限离散的,因此图像称为数字图像<位图>.
大小为M×N的数字图像由M行N列的有限元素组成,每个元素都有特定的特征
位置和幅度表示图像在行和列位置的物理信息,例如灰度和彩色. 这些元素称为图
像元素或像素.
坐标约定
采样和量化的结果是一个真实的矩阵. 本书使用两种主要方法来表示数字图像. 假设在对图像f(x,y)进行采样之后,可以获得具有M行N列的图像. 我们称该图像的尺寸为M×N. 相应的值是离散的. 为了使符号清晰方便,这些离散标签都是整数. 在许多图像处理书籍中,图像的原点定义为(x,y)=(O,0). 图像中第一行的下一个坐标点是(x,y)=(O,1). 符号(0,1)用于指示沿第一行的第二个样本. 采样图像时,并不意味着物理坐标中有实际值. 图1-2(时间)显示了此坐标约定. 请注意,x是从0到M-1的整数,而y是从0到N-1的整数.
图像处理工具箱中的数组使用的坐标约定与上述坐标约定之间有两个区别. 首先,工具箱使用(r,c)而不是(x,y)表示行和列. 但是,坐标顺序与前面讨论的相同. 在这种情况下,坐标对(a,b)的第一个元素表示行,第二个元素表示列. 其次,该坐标系的原点为(r,c)=(l,1). 因此,r是从1到M的整数,而c是从1到N的整数. 图1-2(b)说明了此坐标约定.
图像处理工具箱文档将图1-2(b)中的坐标称为像素坐标.
其中,行和列(M行和N列)必须为正整数,离散灰度级的数量L通常为k的2的幂,并且k为整数(因为二进制整数值表示灰度值),则图像的动态范围为[O,L-1],则图像存储所需的位数为b = M×N×k. 需要说明的是,在矩阵f(y,x)中,通常使用第一行下标和下一列下标表示法,因此这里是坐标y(对应行),然后是横坐标x(对应于该列).
在某些图像矩阵中,许多像素具有相同的值. 例如,在纯黑色背景上以不同灰度轮廓勾勒出的图像,其大多数像素的值为0. 这种矩阵称为稀疏矩阵(Sparse). 您可以简单地描述非零元素的值和位置,而不用编写大量的0元素. 此时,可以大大减少存储图像所需的位数.

图像的矩阵表示形式

图像输入,输出和显示
您可以使用imread函数将图像读取到MATLAB环境中. imread的基本语法为:
未读(“文件名”}
在这里,文件名是一个字符串,其中包含图像文件的全名(包括任何可用的扩展名). 例如句子
f = imread('Fig0101.tif');
将图像fig0101读入图像数组f. 请注意,单引号(')用于分隔文件名字符串,命令行末尾的分号用于禁止在MATLAB中输出. 如果命令行中不包含分号,MATLAB将显示命令行指定的操作结果. 当提示符(“)出现在MATLAB命令行窗口中时,它指示命令行的开始
使用imshow函数在MATLAB桌面上显示图像. imshow的基本语法为: imshow(f)
其中f是图像数组
图1-1显示了屏幕上的输出. 请注意,图形编号显示在最终图形的左上方. 如果是另一个
然后用imshow显示图像q,MATLAB用新图像替换它
》figure,imshow(g)
使用imwrite函数将图像写入当前日录,imwrite的基本语法如下:
imwrite(f,’filename')
类别和图像类型
尽管使用了整数坐标,但是MATLAB中的像素值(亮度)不限于整数. 表1-1列出了MATLAB和图像处理工具箱支持的用于描述像素值的各种类. 表中的前8个项目是数字数据类型,第9个项目称为字符类型,最后一个项目称为逻辑类型.
uint8和逻辑类广泛用于图像处理. 读取TIFF或JPEG图像文件格式的图像时,将使用这两类. 这两个类使用1个字节表示每个像素. 某些科学数据源,例如医学影像,需要超出uint8的动态范围: 对于此类数据,使用uint16和int16. 这两个类为每个矩阵元素使用2个字节. 为了计算灰度运算,例如傅立叶变换(请参见第3章),请使用双浮点和单浮点类. 双精度浮点数每个数组元素使用8个字节,而单精度浮点数则使用4个字节. 尽管该工具箱支持int8,uint32和int32类,但它们在图像处理中并不常用

该工具箱支持4种图像类型
1. 二进制图片
每个像素只有黑色和两种颜色的图像称为二进制图像. 在二进制图像中,像素只有两个值: 0和1. 通常,0用于黑色,而1用于白色.
2. 灰度图像
进一步将黑白之间的许多颜色检测添加到二进制图像以形成灰像. 这种类型的图像通常显示为从最暗的黑色到最亮的白色的灰度. 每个灰度
3.RGB图像
众所周知,自然界中几乎所有颜色都可以与红色(红色,R),绿色(绿色,G)和蓝色(蓝色,B)的三种颜色组合. 通常将它们称为RGB的三种原色. RGB模型是用于显示彩像的最常用的计算机. 对于每个像素,可以通过控制R,G和B三种原色的合成比例来确定像素的最终显示颜色.
对于三种原色RGB而言. 您可以使用L级(如灰度图像)来表示它包含这种颜色
颜色分量的数量. 例如,对于具有256个级别的红色,0表示没有红色成分,255表示仍包括10个
红色部分. 同样,绿色和蓝色也可以分为256级. 因此每个原色都可以使用8位二进制
数据表示,因此3种原色总共需要24个二进制数,因此可以表示的颜色类型数为256×256×256 == 224,大约为1600万,这远远超过了普通颜色人们可以区分. 颜色数.
RGB颜色代码可以使用十六进制数字来减少写入长度,并将R,G和B的三个颜色级别写入两位数组.
未压缩的原始BMP文件使用RGB标准给定的3个值来存储图像数据,称为
RGB图像. RGB图像中的每个像素均由24位二进制数表示,因此也称为24位真彩像.

4. 索引图片
如果每个像素直接由24位二进制数表示,则图像文件的容量将变得非常大. 例如
五十铃对于长宽为200像素,色号为16的彩像,每个像素使用RGB 3分量表
显示每个像素用3个字节表示,整个图像为200×200×3 = 120圈. 完全未压缩
表示方法浪费了很多存储空间. 这是另一种节省空间的存储方法的简要介绍: 索引图像.
它也是200像素×200像素的16像. 由于这张图片中最多只有16种颜色,所以
您可以使用色表(16×3二维数组>保存与这16种颜色相对应的RGB值,以表示图像的瞬间
使用颜色表中这16种颜色的索引
颜色表中的第三个元素是0XAA1111,因此图像中所有颜色为0XAA1111的像素都可以从3-1 = 2更改
表示<颜色表的索引从0开始>. 这样,每个像素需要使用的二进制数只有4位(0.5
bytes>,整个图像只能存储200×200×0.5 = 20kB,而不会影响显示质量.
上面提到的颜色表通常称为调色板(Palete),另一种方法称为颜色查找表(LUT,Look
上表). Wmdows位图使用调色板技术. 实际上,不仅是Windows位图,而且还有许多其他图像
PCX,TIF,GJF等文件格式已应用了此技术.
在实际应用中,调色板中通常少于256种颜色. 使用许多图像编辑工具生成图像或
在编辑GIF文件时,系统通常会提示用户选择文件中包含的颜色数量. 选择较少的颜色时,
它将有效地减小图像文件的大小,并在一定程度上降低图像的质量.
使用调色板技术要求较小的图像文件大小的条件是图像中的像素数量相对较大,并且颜色类型相对相对
少. 如果在图像中使用所有24位真实色彩,则对其使用颜色查找表技术完全没有意义,并且不可能从颜色角度对其进行压缩.
数字图像的本质
f(x,y)的定义仅适用于最一般的情况,即静态灰度图像. 严格来说,数字图像可以是2个变量(对于静态图像)或3个变量(对于动态图像). )
离散功能. 对于静态图像,它是f(x,y),但是在动态图像中,还需要时间参数t,即f(x,y,t): 函数值可以是数值值(对于灰度图像>,或者可以是一个
矢量(用于彩像)
图像的空间和灰度分辨率

空间分辨率>
图像的空间分辨率是指图像中单位长度的像素或点数,通常以每英寸像素(ppi)为单位. 以单位表示. 例如,72ppi表示图像每英寸包含72个像素或点. 分辨率越高,图像越清晰,图像文件所需的磁盘空间越大,并且编辑和处理所需的时间越长.
像素越小,单位长度中包含的像素数据越多,分辨率越高. 然而,在相同物理尺寸范围内的相应图像的尺寸也将更大,并且存储图像所需的字节数也将更多. 因此,在图像放大和缩小算法中,放大是图像的过采样,而缩小是图像的欠采样. 这些内容将在“第4.5节图像缩放”中进一步介绍.
通常,当不需要实际测量所涉及像素的物理分辨率时,通常将M×N大小的数字图像的空间分辨率称为M×N像素.
图0.3显示了同一图像在不同空间分辨率下的不同效果. 当高分辨率的图像以低分辨率表示时,在相同的显示或打印条件下,图像的尺寸将变小,细节将变得不那么明显: 当低分辨率的图像放大时,图像的细节将变大. 图像仍然模糊,但是尺寸变大. 这是因为缩小后的图像丢失了很多信息,并且只能通过复制图像时放大行和列的插值方法来确定新添加的像素的值.

图像/辐射测量分辨率的灰度级
在数字图像处理中,灰度分辨率(也称为色标)是指图像中可区分的灰度数,即上述灰度数L,与存储的灰度一起使用数据类型相关的. 由于灰度用于测量投射到传感器上的光辐射值的强度,因此灰度分辨率也称为辐射测量分辨率.
随着图像的灰度分辨率逐渐降低,图像中包含的颜色数量变少,这会导致在颜色角度损坏图像信息,并且还会影响图像细节的表达. 一定程度,如图0.4所示.

数字图像处理和识别

从信息论的角度来看,图像应该是对象中包含的信息的概括,而数字图像处理则着重于转换这些广义信息,例如增加或减小Juan的值,而数字圆图像分析提取此信息以供其他过程调用. 当然,在不太严格的时候,数字图像处理也可以指图像处理和分析.
读者可能听说过另一种概念,即计算机图形学,与数字图形分析大致相反. 这是处理和显示由概念或数学表示的对象图像的过程.
数字图像处理的初步知识
数字图像由一组具有一定空间位置关系的像素组成,因此具有一定的度量和拓扑特性.
了解像素之间的关系是学习图像处理的必要准备,主要包括相邻像素,相邻性,连通性,面积,
诸如边界之类的概念以及将来将要使用的一些常见的距离测量方法. 此外,第0.3.3节还将简要介绍几个基础
此图像处理.
邻接,连通性,区域和边界
为了理解上述概念,您需要首先了解相邻像素的概念. 根据不同的标准,我们要注意
像素P的4邻域和8邻域如图0.6所示.

邻接

定义Y是一组用于确定邻接关系的灰度值. 它是一种相似性度量,用于确定需要判断相邻性的像素之间的相似度. 例如,在二进制图像中,如果我们认为只有灰度值为1的像素相似,则V = {l}. 当然,相似性规则具有主观标准,因此也可以将其视为推论{O,l},此时间相邻性完全由位置决定: 对于灰度图像,此集合可能包含更多元素. 另外,将对角邻域$ N_d(P)定义为不属于4邻域的8邻域,然后

连接性

区域和边界
区域的定义基于连接的集合. 令R为图像中像素的子集. 如果R也是一个连通集,则R被称为一个区域.
边界的概念. 它是相对于该区域的. 区域的边界(或边缘,轮廓)是该区域中所有像素的集合,其中包含一个或多个不在区域R中的相邻像素. 显然,如果区域R是整个图像,则边界为由图片的第一行,第一列,最后一行和最后一列定义. 因此,在正常情况下,区域是指图像的子集,并且包括该区域的边缘. 区域的边缘由具有某些导数值的像素组成. 它是像素及其附近像素的局部属性,是具有大小和方向属性的向量.
边界和边缘不同. 边界是与区域有关的全局概念,边缘代表图像功能的局部性质
几种距离测量方法

基本图像处理
在以下各章中,将涉及各种图像操作. 以下是一些最典型且最常用的图像操作作为示例. 根据已处理图像的数量,可以将其分为对单个图像的操作(例如滤波)和对多个图像的操作(例如求和,差和逻辑运算): 根据操作中涉及的不同像素范围,它可以分为点运算和邻域运算: 根据运算的数学性质,可以分为线性运算和非线性运算.
点操作和邻域操作
点操作指的是图像中每个像素的相同灰度转换操作. 令r和s为任意点的输入图像f(x,y)和输出图像g(x,y). (x,y)灰度值,可以通过以下公式定义点操作:
s = T(r)
如果扩展了点操作,则对图像中每个小范围
g(x,y)= T [f(x,y)]
线性和非线性运算
让H成为输入和输出均为图像的运算符. 如果对于任意两个(或两组)图像F1和F2以及任意两个标量a和b,则以下关系成立:
H(aF1 + bF2)= aH(F1)+ bH(F2)
H被称为线性算子. 也就是说,将该操作符应用于两个图像的线性组合的结果与将操作符以相同的线性组合应用之后的图像相同,这意味着操作符H满足线性性质. 类似地,不满足以上定义的运算符是非线性运算符,对应于非线性图像运算. 例如,滤波中的平均平滑,高斯平滑和梯度锐化都是线性运算,而中值滤波(请参见第5章“空间域图像增强”)是非线性的.
由于其稳定性,线性操作在图像处理中占据着非常重要的位置. 尽管非线性算子通常可以提供更好的性能,但是它们的不可预测性使其难以广泛应用于军事图像处理和医学图像处理等严格的应用领域.
操作员
通常,我们使用字母M和N分别表示矩阵中的行和列. 1x N
矩阵称为行向量,M * 1矩阵称为列向量,1 * 1矩阵称为标量.
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/shumachanpin/article-303507-1.html
列黑名单