首页 > 操作系统 >

图像识别中人体检测的HOG特征提取方法解析

电脑杂谈　发布时间：2019-05-04 06:25:07　来源：网络整理

图像颜色识别_图像识别和特征提取_序列号识别图像

方向梯度直方图（Histogram of Oriented Gradient， HOG）

特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。HOG特征通过计算和统计图像局部区域的梯度方向直方图来构成特征。

在一副图像中，局部目标的表象和形状能够被梯度或边缘的方向密度分布很好地描述。其本质为：梯度的统计信息，而梯度主要存在于边缘的地方

Hog特征结合SVM分类器已经被广泛应用于图像识别中，尤其在行人检测中获得了极大的成功。

实现方法：

2、首先将图像分成小的连通区域，这些连通区域被叫做细胞单元。然后采集细胞单元中各像素点的梯度的或边缘的方向直方图。最后把这些直方图组合起来，就可以构成特征描述符。

3、性能提高：

将这些局部直方图在图像的更大的范围内（叫做区间）进行对比度归一化，可以提高该算法的性能，所采用的方法是：先计算各直方图在这个区间中的密度，然后根据这个密度对区间中的各个细胞单元做归一化。通过这个归一化后，能对光照变化和阴影获得更好的效果。

因此HOG特征是特别适合于做图像中的人体检测的。

1、色彩和伽马归一化。

A）、什么是图像的归一化

具体思路是：使用sift算法进行识别（特征点的提取并用特征向量对特征点描述，接着当前视图的特征向量与目标对象的特征向量进行匹配），根据识别出来的原目标和帧图像匹配关系得到变化矩阵，来显示三维物体（使用opengl来绘制），实现跟踪。实际上，在运用的时候，我们通常是选取一幅图像中的一个窗口来进行特征提取，依然以上述220x310大小图像为例，经过缩放处理后为216x304，但并不直接提取整个图像的hog特征，而是用一个固定大小的窗口在图像上滑动，滑动的间隔为8个像素，opencv中默认的窗口大小为128x64（高128，宽64），即有(128÷8)x(64÷8)=16x8个cell，也即有15x7个block，这样一来一幅图像就可以取到(27-16)x(38-8)=11x30=330个窗口。 2.2.3 变换系数特征变换系数特征指先对图像进行 fourier 变换、小波变换等，得到的系数后作为特征进行识别。

这样可以减少光照因素的影响

2、计算图像梯度

计算图像横坐标和纵坐标方向的梯度，计算每个像素位置的梯度方向值；

从原始图像当中抽象出来的数据图像数字符号等等的这些标记称为图像特征。

唯一性，完整性，几何变换不变性，名感性，抽象性

运用图像分割的方法，进行处理成为

1）面积

2）位置为图像执行的位置，图像的之心的计算法方法是

位置为质心所在的位置

hog特征提取方法

为转动惯量最小的那个轴，使得所有的点距离该轴的距离的欧氏距离最小。

hog特征提取方法

使用链码表示物体的边界

图像颜色识别_序列号识别图像_图像识别和特征提取

第4章信道编码 2. 多项式表示数码用多项式来表示是一种比较直观的方法，如5位二进制数字序列11010可表示为 4 3 2 1 0 1×2 ＋1×2 ＋0 ×2 ＋1×2 ＋0 ×2 11010 通常在编码中，以x表示系数只取0、1的多项式的基，则上述５位二进制序列可表示为 4 3 2 1 0 4 3 1×x ＋1×x ＋0 ×x ＋1×x ＋0 ×x x ＋x ＋x 这种以多项式的系数表示二进制序列的方法给编码处理带来了方便, 一个 n ，k 循环码的k位信息码可以用x 的k-1次多项式来表示，即 k-1 k-2 2 a x a x +a x +…+a x +a x+a （4-1 ） k-1 k-2 2 1 0式中，a ～a 为多项式的0 、1系数值。翻译过来就是“时序列用来存储时序列（-）数据并以时间（点或区间）建立索引的软件。下面看到第六个动作标签--任务-物体，点击之后右边又会出现几个次级标签，这个效果表示安排一个目标对象执行什么任务，而它执行任务的对象则是另外一个目标，可能不是太懂，我举一个例子，我在左边的目标栏中选择目标对象a1，在右边的目标栏中选择目标对象a2，下面的动作标签表示a1目标将采取什么其他的行为或者释放什么技能，把下面的动作标签拉开，可以看到一系列选项，如果我选择正常，那么a1就会以正常的的行为去执行任务，任务目标则是a2，就好像，我的鼠标选中的a1对应的单位，然后右键a2对应的单位，大家知道，如果a1和a2是地方，那么效果很明显，选中a1右键a2表示我要a1去攻击a2，这个效果触发之后，a1对应的单位就会行动去寻找a2对应的单位，然后攻击他们，如果a1和a2是友方或者己方，则a1对应的单位仅仅会走到a2对应的单位那边去，总之，任务-物体（正常）可以类比为选中一个目标，右键另一个目标，那么行为不是正常呢。

链码就是用来表示目标物体边界上的点的数值序列，可以结婚时呢个存储信息，而且可以准确的去顶物体的一些信息。

什么是链码表

hog特征提取方法

原链码：

归一化链码：

原链码具有平移不变性，但是当起点不同时候，会有不同的链码，所以要使用归一化链码，确定那个起始点，使得链码的存储数据最小。

差分码：

由于归一化链码不具有旋转不变性，于是定义了差分链码。

hog特征提取方法

傅里叶描述子（傅里叶变换的一个作用就是使得在信息量不发生变化的情况下将数据的表达形式发生变化，例如卷积，就是将数据从以为变化到二维空间当中）。

采用傅里叶描述的一个优点是讲二维问题转化为一维问题，

hog特征提取方法

使用傅里叶描述子的方法是：省略后面的n-m个点。

hog特征提取方法

除此之外还有偏心度。

什么叫做矩：

矩在统计学中可以表征随机变量的分布，而在力学中用于表征特征物质的分布。

二值图是一种二维密度的分布函数。

二维矩不变理论p+q阶矩的定义：

hog特征提取方法

P+q阶矩的定义

hog特征提取方法

图像识别和特征提取_序列号识别图像_图像颜色识别

其中，x拔和y拔是图像的灰度的中心点。

直方图特征

数字图像可以看作是一个二维随机过程的一个样本，用联合该类分布来描述。

图像的直方图描述了一幅图像的概貌，在前述灰度变换的实例中（尤其是灰度拉伸），经过灰度变换之后，图像的灰度值在整个［0， 1］灰度级上分布更加均匀，图像的显示效果明显改善。直方图均衡化的目标是期望输出图像的灰度概率密度函数均匀分布，在离散情况下，即图像灰度的累积分布概率与灰度的取值区间长度成正比。梯度直方图特征(hog)是一种对图像局部重叠区域的密集型描述符,它通过计算局部区域的梯度方向直方图来构成特征。

这里写图片描述

B表示了灰度级别，该灰度b在图像中出现的频率P（b）m表示了图像中的总像素数目。N（b）表示像素为灰度值b的数目。

P（b）表示了区域的概率密度函数。

直方图给出了灰度图像额全局描述。在实际当中使用从直方图中提取出来的一阶统计测度。来区别类别间的特征差异

有均值，方差，能量，熵、偏度

偏度：

数据集关于中心点u分布的对称情况。

这里写图片描述

如果大于零，则表示图像像素偏于中心点的右边。

hog特征提取方法

在图像处理领域当中，均值u反应图像的平均亮度，方差反应图像灰度级分布的分散性。但是这两个值容易受到图像采样情况的影响。图像识别和特征提取 所以应该对他图像进行归一化处理。。使得所有图像中的所有图像都具有相同的均值和方差。能量是灰度分布对于原点的二阶矩，如果图像灰度值的等概率分布，则能量最小，熵是图像中信息量多少的反应，对于等概率分布，熵最大。

2、特征直方图

设 N（xi）为图像II中某一特征值为xi的像素个数.M为像素总数。

这里写图片描述

图象的特征直方图为

这里写图片描述

特征直方图就是某一个特征的该类分布，例如，对于灰度图像，直方图就是灰度的概率分布。

hog特征提取方法

3、什么是梯度方向直方图

hog特征提取方法

即将梯度的方向正在（-Pi/2，pi/2）中分成k个均匀的区域，

图像识别和特征提取_序列号识别图像_图像颜色识别

hog特征提取方法

这里写图片描述

或者是梯度幅值的其他形式。但是他们都可以在一定的程度上反应像素上一定的边缘信息。

每一个像素点附近的梯度特征是一个k维向量。

图像的梯度方向直方图就是图像中所有像素点的k维团体都特征进行的直方图统计。

3.1、梯度主要存在与边缘的地方重点内容**

使用hog特征对物体来进行特征描述。

1、图像的归一化，传统的图像归一化一般采用gamma标准化形式：

hog特征提取方法

b）根据梯度计算的公式讲每个像素的梯度赋值和方向。

c）直方图统计的放个单元划分。将图像分成单元和块。一个图像由若干个放个单元组成，

文本粒度的向量维度特征数据提取单元，用于提取文本粒度的向量维度特征数据，包括：设短文本对为(sn1，sn2)，对应的文本向量为(tn1，tn2)，分别计算向量tn1和tn2对应维度的差值Δi，i＝(1,2,......,k)。（3）板线单元截面几何特征计算 1）水平板线单元特征计算2)、斜板线元特征计算对1-1轴的惯性矩对2-2轴的惯性矩 3）、弧板线元特征计算对1-1轴的惯性矩对2-2轴的惯性矩1) 当压型钢板受压翼缘的宽厚比不超过表4.2.1所规定的最大的宽厚比时，受压翼缘的有效计算宽度见下图，可按表4.2.2中所列的相应的公式计算。本来1个block对滑动窗口贡献的向量维数为36维，即每个cell贡献9维，其顺序分别为cell0,cell1,cell2,cell3.而e区域内的像素由于同时对cell0和cell2有贡献，所以在计算e区域内的像素梯度投票时，不仅要投向它本来的cell0，还要投向下面的cell2，即投向cell0和cell2有一个权重，该权重与该像素点所在位置与cell0，cell2中心位置的距离有关。

e）对hog特征向量进行归一化，归一化操作是对块进行的，主要是为了使得特征向量空间对光照阴影和变化具有鲁棒性。归一化常用的函数如下：

hog特征提取方法

6）特征向量的生成

例如，对于64*128的图像而言，每2*2的单元（16*16的像素）构成一个块，每个块内有4*9=36个特征，以8个像素为步长，那么，水平方向将有7个扫描窗口，垂直方向将有15个扫描窗口。实际上，在运用的时候，我们通常是选取一幅图像中的一个窗口来进行特征提取，依然以上述220x310大小图像为例，经过缩放处理后为216x304，但并不直接提取整个图像的hog特征，而是用一个固定大小的窗口在图像上滑动，滑动的间隔为8个像素，opencv中默认的窗口大小为128x64（高128，宽64），即有(128÷8)x(64÷8)=16x8个cell，也即有15x7个block，这样一来一幅图像就可以取到(27-16)x(38-8)=11x30=330个窗口。dalal提出的hog特征提取的过程：把样本图像分割为若干个像素的单元（cell），把梯度方向平均划分为9个区间（bin），在每个单元里面对所有像素的梯度方向在各个方向区间进行直方图统计，得到一个9维的特征向量，每相邻的4个单元构成一个块（block），把一个块内的特征向量联起来得到36维的特征向量，用块对样本图像进行扫描，扫描步长为一个单元。

这样得到的hog特征向量是

这里写图片描述

3.2 hog特征提取的快速算法

上面给出的是穷举搜索算法，计算量偏大，基于积分直方图的hog的特征提取方法。

hog特征提取方法

使用H（x，y，k） = H（x-1，y，k）+ H（x，y-1，k）+ H（x-1，y-1，k）+Q（x，y）。这个迭代的式子来计算（x，y）点出的积分直方图。

其中q（x，y）为在点（x，y）处的梯度向量计算公式。

计算处各个点处的对应的直方图之后，图8-13中区域v的直方图Hv计算公式为：

hog特征提取方法

序列号识别图像_图像颜色识别_图像识别和特征提取

这样计算出来的梯度方向直方图，可以节省大量的计算时间。

第二篇：csdn上的学习资料重点内容

Hog方向梯度直方图和svm支持向量机的结合是图像识别中的广泛使用的一种方法。

HOG+SVM进行行人检测的方法是法国研究人员Dalal在2005的CVPR上提出的。

先将图像划分为许多小的联通区域（细胞单元），然后采集细胞单元中各个像素点的梯度或者边缘的方向直方图。最后将这些直方图组合起来就可以构成特征描述器。

hog特征提取方法

此处的计算梯度方向的方法的原理是使用偏微分，实际上使用的是使用微分的定义式来进行的。这里使用的是一个以为的离散微分模板，将图像同时在水平方向和垂直方向进行处理。

注意：微分的计算公式是dy/dx，在这里没有除以dx，是因为dx就等于1.

把各个细胞单元组合成大的、空间上连通的区间（blocks）。这样，一个block内所有cell的特征向量串联起来便得到该block的HOG特征。这些区间是互有重叠的，这就意味着：每一个单元格的特征会以不同的结果多次出现在最后的特征向量中。我们将归一化之后的块描述符（向量）就称之为HOG描述符。

行人检测的最佳参数设置是：3×3细胞/区间、6×6像素/细胞、9个直方图通道。则一块的特征数为：3*3*9；

Hog的核心的思想是物体的边缘你的梯度直方图能够被边缘方向的直方图和光强强度梯度描述。所以就使用边缘方向来描述物体的边界，进而为区分物体做好基础。而直方图能够表述整个图像的各种特征信息在图像上的分布情况。

此步就是为图像的每个细胞单元构建梯度方向直方图。细胞单元中的每一个像素点都为某个基于方向的直方图通道投票。

投票是采取加权投票（weighted voting）的方式，即每一票都是带权值的，这个权值是根据该像素点的梯度幅度计算出来。

可以采用幅值本身或者它的函数来表示这个权值，实际测试表明：使用幅值来表示权值能获得最佳的效果，当然，也可以选择幅值的函数来表示，比如幅值的平方根、幅值的平方、幅值的截断形式等。

细胞单元中的每一个像素点都为某个基于方向的直方图通道投票。子，它可以有三个参数来表征：每个区间中细胞单元的数目、每个细胞单元中像素点的数目、每个细胞的直方图通道数目。知识单元三土中应力计算知识点二地基的附加应力知识点二附加应力地基中的附加应力附加应力是由于修建建筑物之后再地基内新增加的应力，它是使地基发生变形从而引起建筑物沉降的主要原因集中荷载作用下的附加应力矩形分布荷载作用下的附加应力条形分布荷载作用下的附加应力圆形分布荷载作用下的附加应力影响应力分布的因素基本解叠加原理集中荷载的附加应力（p。

作者发现，采用无向的梯度和9个直方图通道，能在行人检测试验中取得最佳的效果。

把细胞单元组合成大的区间。

由于局部光照的变化以及前景-背景对比度的变化，使得梯度强度的变化范围非常大。这就需要对梯度强度做归一化。

这就需要对梯度强度做归一化，作者采取的办法是：把各个细胞单元组合成大的、空间上连通的区间(blocks)。引入v表示一个还没有被归一化的向量它包含了给定区间（block）的所有直方图信息。这些区间是互有重叠的，这就意味着：每一个细胞单元的输出都多次作用于最终的描述器。

这些区间是互有重叠的，这就意味着：每一个细胞单元的输出都多次作用于最终的描述器。区间有两个主要的几何形状：矩形区间（R-HOG）和环形区间（C-HOG）。

子，它可以有三个参数来表征：每个区间中细胞单元的数目、每个细胞单元中像素点的数目、每个细胞的直方图通道数目。例如：行人检测的最佳参数设置是：3×3细胞/区间、6×6像素/细胞、9个直方图通道。在实验中，这类物质的主要作用是通过抑制相应的蛋白激酶活性，来研究该蛋白激酶的功能，比如想要研究pi3k在某个生理或病理活动中的作用，可以对细胞或组织用pi3k的抑制剂处理，来检测各个生理指标包括蛋白以及表征的的变化，这和楼主的实验很相似。

作者还发现，在对直方图做处理之前，给每个block加一个高斯空域窗口（Gaussian spatial window）是非常必要的，因为这样可以降低边缘的周围像素点的权重。R- HOG跟SIFT描述器看起来很相似，但他们的不同之处是：R-HOG是在单一尺度下、密集的网格内、没有对方向排序的情况下被计算出来；而SIFT描述器是在多尺度下、稀疏的图像关键点上、对方向排序的情况下被计算出来。补充一点，R-HOG是各区间被组合起来用于对空域信息进行编码，而SIFT的各描述器是单独使用的。

这里写图片描述