1. 可鉴别的多特征联合稀疏表示人脸表情识别方法
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2015)25-0137-03
人脸的表情包含了人体行为的情感信息和心理信息,这是人们在进行非语言的交流时所采取最有效的手段。人们可以根据表情来充分地将自己的思想以及情感表达出来,同时根据人脸表情来对对方内心世界和对方的态度来加以了解,所以说人脸的表情在日常生活当中扮演着极为重要的角色。表情能够将很多的语言以及声音不能够表达出来的信息给表达出来,其在医疗和语言学以及相关的服务行业中都在发挥着极为重要的作用。
1 人脸表情识别的技术现状
1.1 提取人脸表情特征
由于提取人脸表情特征采取的图像类型不一样,对此我们可以将其分成静态表情的图像特征进行提取以及序列表情的图像特征进行提取这两种。第一种提取的是表情静止时的特征,第二种提取的是表情在运动过程中的特征,对于第一种的提取方法一般为Gabor小波,主成份分析(PCA)以及线性的判断分析(LDA)等的方法;而针对与第二种的提取方法有特征点跟踪,查分图像法以及光流法等。
1)提取静态的表情特征的常用方法
PCA主要是用在抽取原始特征以及降维,这种方法运算的中心思想是把二维的图像转为一维向量,根据从大到小的排列顺序对特征值以及特征向量加以调整,并且通过K-L的变换投影获得正交基,对其加以取舍进而得到人脸的表情特征其子空间。其实际上识别表情的过程就是把测试的样本进行比较投影进表情特征的子空间里,之后再将其跟测试的样本加以比较判定出它的表情类别。Gabor小波这种方法是现在我们比较常用的一种表示特征的方法,它能够有效地将环境噪音加以清除,使提取的图像特征有效加强,主要是通过图像在不同方向不同尺度上的频率信息对图像的特征加以表明。
2)提取变动的表情特征常用的方法
对于序列图像特征加以提取的代表性方法就是光流法。这种方法在1981年被第一次提出,主要是根据对视频图像里的表情特征光流加以计算进而得到每一个特征点的运动情况,这就是表情特征。
第一种提取特征的方法它采集较方便,计算更快捷,但是不能够对更大时间和空间信息加以探知。而第二种提取特征的方法虽可以对运动的表情信息加以提取,进而使得到的识别效果较好,但这种方法其计算的数据量较庞大,且具有很高的重复率,实际的操作当中比较困难。因此从目前来看,提取表情特征应该朝着将各种提取方法相互融合来对信息加以特征提取。
1.2传统的人脸表情识别系统中存在的问题
对于人类表情识别的研究中可以依据人类对不同的表情加以区别上获得启发,但运用计算机的视觉技术准确地对人脸表情进行识别的系统,实际运用中还有很多难题。
1) 不容易建立起理想的人脸表情相关模型
因为人脸是比较柔的,所以把人的表情和情感进行分类,在此基础上再建立一个模型,把人类的表情特征以及情感信息再相对应这就显得十分的困难。
2)表情数据库不完善
现在很多研究的实验结果都是在各自研究团队里研发出来的表情数据库的基础上得到的,我们知道每一个表情库由于噪音或者是光照等环境方面的影响都各不相同,再加上每个表情库里的人脸图像在文化,种族当中都存在着比较大的区别,所以实验的结果应该多次加以重复验证,增加推广能力。
3)学科方法和技术有自身的局限性
尽管我们在对人脸识别的系统中研究工作正在逐步加深,得到了很大的进步,但因为很多的研究者都是自己展开工作,在新技术和新方法将优点充分发挥出来的同时也不可避免地有着自身的局限性,多种技术相互融合上面的工作开展得还比较慢。
2 提取改进LBP的人脸表情特征
局部二元模式(LBP)指的是一个能描述算子的有效图像纹理特征,根据存在于图像中的任意一点和它相邻那点的灰度值中发生的大小关系来判定图像中部分纹理空间构造,从这方面上来看,它有旋转和抗亮度变化的能力。
2.1 原始的LBP算子
LBP一开始先将图像中各个像素点之间的灰度值加以计算,将在各个像素点和跟她相邻的点存在于灰度值上的二值关系加以计算,根据计算后得出的二指关系根据相应规则来形成局部二值的模式,同时将多区域的直方图序列当做这个图像的一个二值模式。
图1 基本的LBP算子计算的过程
一个基本的LBP算子应该是上图1所示那样,将其定义成3*3的窗口,有8个邻域的像素点,把窗口中心点的灰度值对窗口内的像素点其灰度值执行二值化,再依据不同的像素点位置来加权求和,进而得到这个窗口LBP编码值。
2.2 改进的LBP算子
从上面我们可以知道原始的算法自身纹理描述力是很强的,但在特定的局域内,原始LBP算子只考虑到了存在于中心像素点跟邻域的像素点之间灰度值的差异,把中心像素点作用以及邻域像素点其灰度值之间的互相关系忽略掉了,因而造成在某些情况下把局部的结构特点信息有所忽略。如下图2就是某种特定的情况。图2 原始的LBP算子在特定情形中的编码
图2中所产生的11111111主要是对暗点以及会读平坦的区域进行检测,可以说是特征检测器。我们在此基础上,对原始的LBP算子进行改进,根据使一位二值编码增加的方式来加以扩展,提出了多重心化的二值模式也就是MLBP,具体的改进过程如图3所示。
图3 改进的LBP算子计算的过程(P=8、R=1)
由图3中获得的两个8位子编码将其当做独立的两 个MLBP的自编码,继而对所有模式直方图加以计算,根据这个直方图来加以分类或者是识别。LBP具体的算法公式如下:
在这当中,N,R分别表示的是临域点的个数和半径,gc表示的是像素点,gn表示的是它的临域点。根据这个改进的MLBP算子我们可以看出,它根据使一位二值的编码增加的形式,在将原始LBP算子的优势得到保持前提下,将中心像素点作用和邻域像素点二者间灰度值的关系又加以利用。跟原始的相比,改进的算子并没有时特征模式有所增加,而且还可以将原始的算子中没有考虑到的中心像素点和邻域像素点灰度值间关系产生的结构特点提取出来,让其鉴别能力得到提高。
3 人脸识别系统的设计
3.1 系统构成
该系统主要是被硬件平台以及软件开发的平台这两部分构成。硬件平台指的就是那些采集图像的设备和计算机系统,而软件开发的平台就是本文中所描述到的在上述所说的算法中改进开发出来的一种人脸识别的系统。
3.2 系统软件
系统软件的构造。系统软件可以划分成以下两个部分。首先是获取图像,当进入到主界面中时,点击打开图像或者是打开视频,系统初始化的硬件设备能够根据直接打开的静态表情图像或者是视频等,来对人脸表情图像进行获取并将图像显示出来,之后再对人脸开始进行检测和定位。其次,就是提取相应的表情特征并对其进行识别。
下面为了对该系统在进行识别表情时的效果进行验证,本文进行了几组对比实验。先将Gabor跟采样降维相结合的特征提取方式下得出的不同分类器效果加以比较,再将该系统下的分类跟其他的分类器效果进行比较。具体如下图4所示。
图4 不同的分类器下表情识别比较图
在图4中,横坐标1-7分别表示的是生气、厌恶、恐惧、高兴和瓶颈、伤心以及惊奇,数字8表示的是所有的表情。
结论:
根据图4我们可看出,在特征提取条件相同情况下,整体实验数据中稀疏表示明显比另两种分类型的性能要好,而且BP神经网络分类效果也非常良好,但是最近邻之间的分类器的精准度没有前两种表现得好。
该文中运用的这种提取特征方法的效果明显比Gabor跟采样降维相结合的方法效果要好。
上面进行的对比实验,充分验证了本文中的分类系统的优越感。下面跟文献中已经有的方案进行对比,具体如下图5所示。
[不同人脸表情识别方法\&识别率\&Gabor+弹性模板匹配[5]\&80%\&特征块PCA+最近邻分析器[8]\&75.45%\&本文方法\&85.71%\&]
图5 跟文献中含有的方案进行比较效果
根据图5所示,我们可以看出,跟其他文献中采用的方法来看,本文采用的方法在表情识别上有着明显的优势。具体的我们还可以从下图6的人脸表情识别界面中看到本文中设计的人脸识别系统具体应用情况。
图6 人脸表情识别的界面
3.3简析人脸识别算法
1)优点
这种算法将以前在迭代过程中的迭矩阵计算大大简化,而且在识别的速度上也得到了有效的提升,能跟随光照的变化进行有效的识别,对人脸进行识别的主要困难就是遮挡、单样本等这些问题,而稀疏表示在这些问题的前提下仍然能具备潜在的发展力,我们可以进一步对其加以研究,这也是现在研究的一个重点方向。
2) 缺点
在上面实验中我们发现其分类器表现出了良好的使用效果,但这种算法也存在着一些不足之处,由于数据量不断地增加,稀疏表示分类需要的时间也会随之而增加。此外,这种表示方法虽然在速度上明显优于其他,但是其产生的识别率并不是很高,也就是说不能准确地对表情进行有效识别。
4 展望人脸表情识别的系统
这种新型的对人脸表情加以识别的系统利于将人们的生活品质提高。当人们一旦从比较寒冷的地方或者是比较炎热的地方回到室内时,可以根据这个表情识别的系统快速地把人们面部表情与最佳温度中人脸表情相对比,进而让空调自动把室内的温度调转至最佳。此外,在医疗行业中,可以将表情识别运用到电子护士护理中来。尤其是对于那些重症病人,在对其进行治疗的过程中可以根据这个具有表情分析能力的机器人护士对病人实行实时的看管护理。除以上几点外,在对儿童实行教育时也可以将其应用其中,可以根据儿童在某种情形下所产生的表情以及行为进行具体分析和观察,有效挖掘他们潜在的气质和能力,引导我们更好地对儿童实行教育,促进儿童的健康成长。
5 结语
综上所述,对人脸表情加以识别是具有很大挑战的新兴课题,笔者主要对存在于人脸表情识别算法中的问题进行了简要的分析,并在此基础上提出了改进的算法进而提出了对人脸表情加以识别的系统。但从目前来看,我国关于人脸识别的系统研究当中还存在着一些问题,因此,对于我们来说将更加智能化的关于人脸表情识别的系统加以实现还是一个十分艰巨的任务,还需要我们不断的努力。
参考文献:
[1] 赵晓龙. 安防系统中的基于稀疏表示的人脸识别研究[D].西北大学,2014.
[2] 朱可. 基于稀疏表示的人脸表情识别[D].西北大学,2013.
[3] 万川. 基于动态序列图像的人脸表情识别系统理论与方法研究[D].吉林大学,2013.
[4] 欧阳琰. 面部表情识别方法的研究[D].华中科技大学,2013.
[5] 王哲伟. 基于稀疏表示残差融合的人脸表情识别[D].五邑大学,2011.
[6] 张慕凡. 基于稀疏表示的人脸识别的应用研究[D].南京邮电大学,2014.
[7] 赵晓. 基于稀疏表示的人脸识别方法研究[D].北京工业大学,2013.
[8] 何玲丽. 基于核稀疏表示的人脸识别方法研究[D].湖南大学,2014.
2. 对一张图片进行特征提取的具体算法和程序。越具体越好。感谢,例如算出图像的形状长宽高之类的。
对一张图片进行特征提取的具体算法和程序,越具体越好,感谢例如算出图像的形状,长宽之类的,我觉得对图片特征提取的体术法并没有什么具体算法,因为每个相机照出来的图片,它的放大缩小都是不一样的,不可能从一个图片算出一个图像的长宽高,只能够算出一个大概的长宽高,如果要算出非常准确的茶膏,只能用一些红外测距仪,还有某些特定的仪器才能构测量出,一些建筑物的长宽高不能够从一个图片上面去算出一个建筑物的长宽高的是根本没法算出来的。
3. 什么是纹理图像
纹理图像一般指图像纹理,图像纹理是一种反映图像中同质现象的视觉特征,它体现了物体表面的具有缓慢变化或者周期性变化的表面结构组织排列属性。
纹理具有三大标志:某种局部序列性不断重复、非随机排列、纹理区域内大致为均匀的统一体。纹理不同于灰度、颜色等图像特征,它通过像素及其周围空间邻域的灰度分布来表现,即:局部纹理信息。局部纹理信息不同程度的重复性,即全局纹理信息。
不同于灰度、颜色等图像特征,纹理通过像素及其周围空间邻域的灰度分布来表现,即局部纹理信息。另外,局部纹理信息不同程度上的重复性,就是全局纹理信息。
纹理特征体现全局特征的性质的同时,它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。
与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局部的偏差而无法匹配成功。
在检索具有粗细、疏密等方面较大差别的纹理图像时,利用纹理特征是一种有效的方法。但当纹理之间的粗细、疏密等易于分辨的信息之间相差不大的时候,通常的纹理特征很难准确地反映出人的视觉感觉不同的纹理之间的差别。
例如,水中的倒影,光滑的金属面互相反射造成的影响等都会导致纹理的变化。由于这些不是物体本身的特性,因而将纹理信息应用于检索时,有时这些虚假的纹理会对检索造成“误导”。
(3)图像纹理特征算法扩展阅读:
纹理图像分类
1、统计型纹理特征。基于像元及其邻域内的灰度属性,研究纹理区域中的统计特征,或者像元及其邻域内灰度的一阶、二阶或者高阶统计特征。
统计型纹理特征中以GLCM(灰度共生矩阵)为主,它是建立在估计图像的二阶组合条件概率密度基础上的一种方法。GLCM主要描述在theta方向上,相隔d个像元距离的一对像元分别具有灰度值i和j的出现的概率。
尽管GLCM提取的纹理特征具有较好的鉴别能力,但是这个方法在计算上是昂贵的,尤其是对于像素级的纹理分类更具有局限性。并且,GLCM的计算较为耗时,好在不断有研究人员对其提出改进。
2、模型型纹理特征。假设纹理是以某种参数控制的分布模型方式形成的,从纹理图像的实现来估计计算模型参数,以参数为特征或采用某种策略进行图像分割,因此,模型参数的估计是这种方法的核心问题。
模型型纹理特征提取方法以随机场方法和分形方法为主。
3、信号处理型纹理特征。建立在时域、频域分析与多尺度分析基础之上,对纹理图像中某个区域内实行某种变换之后,再提取保持相对平稳的特征值,以此特征值作为特征表示区域内的一致性以及区域间的相异性。
信号处理类的纹理特征主要是利用某种线性变换、滤波器或者滤波器组将纹理转换到变换域,然后应用某种能量准则提取纹理特征。因此,基于信号处理的方法也称之为滤波方法。大多数信号处理方法的提出,都基于这样一个假设:频域的能量分布能够鉴别纹理。
4、结构型纹理特征。基于“纹理基元”分析纹理特征,着力找到纹理基元,认为纹理由许多纹理基元构成,不同类型的纹理基元、不同的方向及数目,决定了纹理的表现形式。
4. 基于内容的图像检索的特征提取
基本体整体趋包含颜色、纹理、平面空间对应关系、外形,或者其他统计特征。 图像特征的提取与表达是基于内容的图像检索技术的基础。从广义上讲,图像的特征包括基于文本的特征(如关键字、注释等)和视觉特征(如色彩、纹理、形状、对象表面等)两类。视觉特征又可分为通用的视觉特征和领域相关的视觉特征。前者用于描述所有图像共有的特征,与图像的具体类型或内容无关,主要包括色彩、纹理和形状;后者则建立在对所描述图像内容的某些先验知识(或假设)的基础上,与具体的应用紧密有关,例如人的面部特征或指纹特征等。 颜色是彩色图像最底层、最直观的物理特征,通常对噪声,图像质量的退化,尺寸、分辨率和方向等的变化具有很强的鲁棒性,是绝大多数基于内容的图像和视频检索的多媒体数据库中使用的特征之一。颜色特征的描述方法主要有以下四种:
颜色直方图(ColorHistogram)
它是最简单也是最常用的颜色特征,描述了图像颜色的统计分布特性,具有平移、尺度、旋转不变性。其核心思想是在颜色空间中采用一定的量化方法对颜色进行量化,然后统计每一个量化通道在整幅图像中所占的比重。
常用的颜色空间有RGB,CIE,HSI,HSV空间等,主要的量化方法有最重要信息位、颜色空间划分、颜色空间聚类、参考颜色、图像分割等,文献中讨论了对这些方法进行了讨论和总结。 由于颜色直方图缺乏颜色的空间分布信息,改进的方法包括在颜色索引时加入空间位置信息和基于区域的颜色查询。最简单的方法是子窗口直方图法,即将图像分割成子图像,一一建立索引。另一文献中将图像分成了大小相等的九个子图像,然后统计每个子图像中的颜色直方图。
颜色相关图(ColorCorrelogram)
其主要思想是用颜色对相对于距离的分布来描述信息,它反映了像素对的空间相关性,以及局部像素分布和总体像素分布的相关性,并且容易计算,特征范围小,效果好。
颜色矩(ColorMoment)
其基本思想是在颜色直方图的基础上计算出每个颜色通的均值、方差、偏差,用这些统计量替代颜色的分布来表示颜色特征。它具有特征量少,处理简单的特点。
颜色一致性矢量(Color Coherence Vectors, CCV)
本质上是一种引入空间信息改进的直方图算法,统计了图像中各颜色最大区域的像素数量。通过分离开一致性像素和非一致性像素,比直方图算法具有更好的区别效果。 纹理是图像的重要特征之一,通常定义为图像的某种局部性质,或是对局部区域中像素之间关系的一种度量,其本质是刻画像素的邻域灰度空间分布规律。纹理特征描述方法大致可以分为四类:统计法、结构法、模型法、频谱法。
统计法
统计法分析纹理的主要思想是通过图像中灰度级分布的随机属性来描述纹理特征。最简单的统计法是借助于灰度直方图的矩来描述纹理,但这种方法没有利用像素相对位置的空间信息。
为了利用这些信息,Haralick 等人提出了用共生矩阵来表示纹理特征。 该方法研究了纹理的空间灰度级相关性,构造出一个基于图像像素间方向和距离的共生矩阵,并且从矩阵中提取出反差、能量、熵、相关等统计量作为特征量表示纹理特征。
Tamura 等人基于人类视觉的心理学研究后提出了一些不同的方法来描述纹理特征,给出了几个不同的描述纹理特征的术语:粗糙度(Coarseness) 、对比度(Contrast) 、方向(Directionality) 、线性度(Linelikeness) 、规则度(Regularity) 、粗略度(Roughness) 等。Tamura 纹理和共生矩阵表示的主要区别在于:前者的所有纹理属性都是视觉意义上的,而后者的某些纹理属性不具有视觉意义(如信息熵) 。这一特点使得Tamura 的纹理表示在图像检索中使用得较多。QBIC 和MARS都进一步证明了这种表示方法。
结构法
结构法分析纹理的基本思想是假定纹理模式由纹理基元以一定的、有规律的形式重复排列组合而成,特征提取就变为确定这些基元并定量分析它们的排列规则。Carlucci曾提出一个使用直线段、开放多边形和封闭多边形作为纹理基元的纹理模型,其排列规则由一种图状语法结构定义。 Lu and Fu给过一种树型语法结构表示纹理,他们将纹理按照9 ×9 的窗口进行分割,每个分解单元的空间结构表示为一棵树。 因为实际的纹理大都是无规则的,因此结构法受到很大限制。
模型法
模型法利用一些成熟的图像模型来描述纹理,如基于随机场统计学的马尔可夫随机场、子回归模型,以及在此基础上产生的多尺度子回归模型 (MultiResolution Simultaneous Autoregressive, MRSA) 等。这些模型的共同特点是通过少量的参数表征纹理。MRSA 区分不同纹理模式的能力较强,但同时计算开销也较大。
频谱法
频谱法借助于频率特性来描述纹理特征,包括傅里叶功率谱法 、Gabor 变换 、塔式小波变换( Pyramid Wavelet Transform ,PWT) 、树式小波变换( Tree Wavelet Transform,TWT) 等方法。Manjunath and Ma 实验指出, Gabor 特征提供了最佳的模式检索精度,检索性能优于TWT 和PWT,略微优于MRSA ,缺点是计算速度慢,其旋转不变性和尺度不变性仍有待讨论。 形状是刻画物体最本质的特征,也是最难描述的图像特征之一,主要难在对图像中感兴趣目标的分割。对形状特征的提取主要是寻找一些几何不变量。目前用于图像检索的形状描述方法主要有两类:基于边缘和基于区域的形状方法。前者利用图像的边缘信息,而后者则利用区域内的灰度分布信息。
基于边缘
基于边缘的形状特征提取是在边缘检测的基础上,用面积、周长、偏心率、角点、链码、兴趣点、傅里叶描述子、矩描述子等特征来描述物体的形状,适用于图像边缘较为清晰、容易获取的图像。文献[16]首先对图像进行了高斯平滑,接着使用经典的兴趣点检测算法发现兴趣点,然后用兴趣点的测度值作为图像特征进行匹配。文献 提出将图像边缘上的角点作为特征点,然后使用Delaunay三角形进行划分,记录三角形的形状特征来描述图像的形状特征。这种方法由于是基于边缘上的一些特殊点,因此对噪声和点位置的变化较为敏感。文献采用边缘方向直方图来刻画形状特征,具有简单、平移不变性等优点,但也存在不具备尺度、旋转不变性等缺点。
基于区域
基于区域的形状特征提取的主要思路是通过图像分割技术提取出图像中感兴趣的物体,依靠区域内像素的颜色分布信息提取图像特征,适合于区域能够较为准确地分割出来、区域内颜色分布较为均匀的图像。文献应用变形模板技术,把用户提供的形状看作模板,与图像库中的形状进行匹配。由于是直接比较两个形状,因此具有较高的精度,但同时计算量也较大。 文献提出了一种形状弹性匹配算法,首先确定感兴趣区域,在这些区域中采用爬山优化算法获取图像边缘,并用这些边缘代表物体形状。 这种方法的优点是对图像边缘进行了筛选,缺点是需要人工干预。近年来,基于区域的图像检索方法已经成为基于内容的图像检索的一大研究热点。
5. 机器视觉特征描述方法
常用的机器视觉提取特征方法有哪些?一般常用的机器视觉图像特征有颜色特征、纹理特征、形状特征、空间关系特征,沃德普机器视觉昨天给大家介绍过了颜色特征的提取,今天给大家介绍的是纹理特征、形状特征、空间关系特征这三种特征方法提取。
1.纹理特征描述方法分类:
(1)统计方法
统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法,在研究共生矩阵中各种统计特征基础上,通过实验,得出灰度共生矩阵的四个关键特征:能量、惯量、熵和相关性。统计方法中另一种典型方法,则是从图像的自相关函数(即图像的能量谱函数)提取纹理特征,即通过对图像的能量谱函数的计算,提取纹理的粗细度及方向性等特征参数。
(2)几何法
所谓几何法,是建立在纹理基元(基本的纹理元素)理论基础上的一种纹理特征分析方法。纹理基元理论认为,复杂的纹理可以由若干简单的纹理基元以一定的有规律的形式重复排列构成。在几何法中,比较有影响的算法有两种:Voronio 棋盘格特征法和结构法。
(3)模型法
模型法以图像的构造模型为基础,采用模型的参数作为纹理特征。典型的方法是随机场模型法,如马尔可夫(Markov)随机场(MRF)模型法和 Gibbs 随机场模型法。
(4)信号处理法
纹理特征的提取与匹配主要有:灰度共生矩阵、Tamura 纹理特征、自回归纹理模型、小波变换等。
灰度共生矩阵特征提取与匹配主要依赖于能量、惯量、熵和相关性四个参数。Tamura 纹理特征基于人类对纹理的视觉感知心理学研究,提出6种属性,即:粗糙度、对比度、方向度、线像度、规整度和粗略度。自回归纹理模型(simultaneous auto-regressive, SAR)是马尔可夫随机场(MRF)模型的一种应用实例。
6. 纹理特征提取方法:LBP, 灰度共生矩阵
搬运自本人 CSDN 博客: 《纹理特征提取方法:LBP, 灰度共生矩阵》
注:本文中大量行内 Latex 公式在中不支持,如果想要仔细参阅,请移步上面的 CSDN 博客链接。
在前面的博文 《图像纹理特征总体简述》 中,笔者总结了图像纹理特征及其分类。在这里笔者对其中两种算法介绍并总结。
参考网址:
《纹理特征提取》
《【纹理特征】LBP 》
《灰度共生矩阵(GLCM)理解》
《灰度共生矩阵的理解》
《图像的纹理特征之灰度共生矩阵 》
参考论文:
《基于灰度共生矩阵提取纹理特征图像的研究》——冯建辉
《灰度共生矩阵纹理特征提取的Matlab实现》——焦蓬蓬
LBP方法(Local binary patterns, 局部二值模式)是一种用来描述图像局部纹理特征的算子;它的作用是进行特征提取,提取图像的局部纹理特征。
LBP是一个计算机视觉中用于图像特征分类的一个方法,用于纹理特征提取。后来LBP方法与HOG特征分类器与其他机器学习算法联合使用。
LBP算法的核心思想,是以某个像素点为中心,与其邻域像素点共同计算。关于邻域像素点的选择方法,其实并不唯一:
这里选择环形邻域的方法进行说明:
窗口中心的像素点作为中心,该像素点的像素值作为阈值。然后将周围8个像素点的灰度值与该阈值进行比较,若周围某像素值大于中心像素值,则该像素点位置被标记为1;反之,该像素点标记为0。
如此这样,该窗口的8个点可以产生8位的无符号数,这样就得到了该窗口的LBP值,该值反应了该窗口的纹理信息。如下图所示:
图中,中心像素点的像素值作为阈值,其值v = 3;周围邻域8个像素值中,有3个比阈值小的像素点置0,5个比阈值大的像素点置1。
LBP算法的计算公式如下:
$$ LBP_{P, R}(x_{c},y_{c}) = sum_{p=0}^{P-1}s(g_{p} - g_{c})2^p, s(x)=left{egin{matrix}1 : x geq 0 0 : x leq 0 end{matrix} ight. $$
LBP纹理特征向量,一般以图像分块LBP直方图表示。具体步骤如下:
得到了整幅图像的LBP纹理特征后,便可以利用SVM或者其他机器学习算法进行分类了。
这两天笔者将会对源码进行测试封装,以后会上传到我的GitHub网站上。
灰度共生矩阵法(GLCM, Gray-level co-occurrence matrix),就是通过计算灰度图像得到它的共生矩阵,然后透过计算该共生矩阵得到矩阵的部分特征值,来分别代表图像的某些纹理特征(纹理的定义仍是难点)。灰度共生矩阵能反映图像灰度关于<font color = red> 方向、相邻间隔、变化幅度等 </font>综合信息,它是分析图像的局部模式和它们排列规则的基础。
对于灰度共生矩阵的理解,需要明确几个概念:方向,偏移量和灰度共生矩阵的阶数。
计算纹理特征第一步,就是将多通道的图像(一般指RGB图像)转换为灰度图像,分别提取出多个通道的灰度图像。
纹理特征是一种结构特征,使用不同通道图像得到的纹理特征都是一样的,所以可以任意选择其一。
一般在一幅图像中的灰度级有256级,从0--255。但在计算灰度共生矩阵时我们并不需要256个灰度级,且计算量实在太大,所以一般分为8个灰度级或16个灰度级。
而且当分成8个灰度级时,如果直接将像素点的灰度值除以32取整,会引起影像清晰度降低,所以进行灰度级压缩时,首先我们会将图片进行直方图均衡化处理,增加灰度值的动态范围,这样就增加了影像的整体对比效果。
注:笔者后文中的例子中,为了简要说明,所以灰度等级简单设置为4。
计算特征值前,先选择计算过程中的一些参数:
下面分部且适当的使用一些例子说明计算过程:
为了达到简单说明计算纹理特征值的目的,笔者此处做简要的假设:灰度被分为4阶,灰度阶从0--3;窗口大小为6 × 6;
窗口A的灰度矩阵A如下:
窗口B的灰度矩阵B如下:
此处以左上角元素为坐标原点,原点记为(1, 1);以此为基础举例,第四行第二列的点记为(4, 2);
情景1:d = 1,求0°方向矩阵A的共生矩阵:
则按照0°方向(即水平方向 从左向右,从右向左两个方向 ),统计矩阵值(1, 2),则如下图所示:
$$
P_{A}(d=1, heta =0^o)=egin{vmatrix}
0 & 8 & 0 & 7
8 & 0 & 8 & 0
0 & 8 & 0 & 7
7 & 0 & 7 & 0
end{vmatrix}
$$
情景2:d = 1,求45°方向矩阵A的共生矩阵:
按照情景1,同理可得此时的统计矩阵结果如下:
$$
P_{A}(d=1, heta =45^o)=egin{vmatrix}
12 & 0 & 0 & 0
0 & 14 & 0 & 0
0 & 0 & 12 & 0
0 & 0 & 0 & 12
end{vmatrix}
$$
情景3:d = 1,求0°与45°方向矩阵B的共生矩阵:
与前面同理,可以得到矩阵B的统计及矩阵结果如下:
$$
P_{B}(d=1, heta =0^o)=egin{vmatrix}
24 & 4 & 0 & 0
4 & 8 & 0 & 0
0 & 0 & 12 & 2
0 & 0 & 2 & 4
end{vmatrix}
$$
$$
P_{B}(d=1, heta =45^o)=egin{vmatrix}
18 & 3 & 3 & 0
3 & 6 & 1 & 1
3 & 1 & 6 & 1
0 & 1 & 1 & 2
end{vmatrix}
$$
矩阵A, B的其余90°、135°矩阵与上面同理,所以笔者偷懒略去。
这样,我们就已经计算得到了单个窗口的灰度共生矩阵的各个方向的矩阵,下面就要用刚才算出的矩阵计算灰度共生矩阵特征值。
用P表示灰度共生矩阵的归一化频率矩阵,其中i, j表示按照某方向同时出现于两个像素的某两个级别的灰度值,所以P(i, j)表示满足这种情况的两个像素出现的概率。
以上述情景2中的矩阵为例:
原矩阵为:
$$
P(d=1, heta =45^o)=egin{vmatrix}
12 & 0 & 0 & 0
0 & 14 & 0 & 0
0 & 0 & 12 & 0
0 & 0 & 0 & 12
end{vmatrix}
$$
归一化后,矩阵形式变为:
$$
P(d=1, heta =45^o)=egin{vmatrix}
12/50 & 0 & 0 & 0
0 & 14/50 & 0 & 0
0 & 0 & 12/50 & 0
0 & 0 & 0 & 12/50
end{vmatrix}
$$
灰度共生矩阵理论的前辈Haralick等人用灰度共生矩阵提出了14中特征值,但由于灰度共生矩阵的计算量很大,所以为了简便,我们一般采用四个最常用的特征来提取图像的纹理特征:<font color=red> 能量、对比度、相关度、熵 </font>。
$ ASM = sum_{i} sum_{j}P(i, j)^2 $
能量是灰度共生矩阵各元素的平方和,又被称角二阶距。它是图像纹理灰度变化均一的度量,反映了图像灰度分布均匀程度和纹理粗细程度。
$ CON = sum_{i} sum_{j} (i-j)^2 P(i,j) $
对比度是灰度共生矩阵主对角线附近的惯性矩,它体现矩阵的值如何分布,反映了图像的清晰度和纹理沟纹的深浅。
$ CORRLN = [sum_{i} sum_{j}((ij)P(i,j)) - mu_{x} mu_{y}]/ sigma_{x} sigma_{y} $
相关度体现了空间灰度共生矩阵元素在行或列方向上的相似程度,反映了图像局部灰度相关性。
$ ENT = - sum_{i} sum_{j} P(i,j) log P(i,j) $
熵体现了图像纹理的随机性。若共生矩阵中所有值都相等,取得最大值;若共生矩阵中的值不均匀,则其值会变得很小。
求出该灰度共生矩阵各个方向的特征值后,再对这些特征值进行均值和方差的计算,这样处理就消除了方向分量对纹理特征的影响。
一个滑动窗口计算结束后,该窗口就可以移动一个像素点,形成另一个小窗口图像,重复进行上一步的计算,生成新窗口图像的共生矩阵和纹理特征值;
以此类推,滑动窗口遍历完所有的图像像素点后,整个图像就形成了一个由纹理特征值构成的一个纹理特征值矩阵。
之后,就可以将这个纹理特征值矩阵转换成纹理特征图像。
笔者已经对源码进行测试了封装,并上传到了笔者的GitHub网站上。
GitHub: https://github.com/upcAutoLang/GLCM-OpenCV
7. 图像纹理特征提取算法是什么有什么用处
通常使用纹理特征模版进行相关性测量,得到相关系数,设定阈值,大于阈值者导致提取。纹理特征的提取通常用于图像识别
8. 劲舞团私服
特征提取是计算机视觉和图像处置中的一个概思,java(6)。它指的是使用计算机提取图像信息,决议每个图像的点能否属于一个图像特征。特征提取的成果是把图像上的点分为不同的子集,这些子集往去属于孤坐的点、持续的直线或许连续的区域。
特征的定义
至古为行特征出有万能和准确的定义。特征的粗断定义往往由答题或许利用类型决议,大明龙权。特征是一个数字图像中“有趣”的部门,它是很多计算机图像剖析算法的出发点。因而一个算法能否胜利往去由它应用和定义的特征决议。果彼特征提取最主要的一个特性是“可反复性”:统一场景的不同图像所提取的特征应当是雷同的。
特征提取是图象处理中的一个低级运算,也就是说它是对一个图像进行的第一个运算处理,手机游戏。它检讨每个像从来断定该像素能否代表一个特征。如果它是一个更大的算法的一局部,这么这个算法一般只检讨图像的特征区域。作为特征提取的一个条件运算,输出图像一般通过高斯含混核在尺度空间中被平涩。尔后通过局部导数运算来计算图像的一个或多个特征。
有时,如果特点降取须要很多的盘算时光,而能够应用的时光无限造,一个下层主算法否以用来把持特征提与阶级,那样仅图像的部门被用来寻觅特征。
由于许多计算机图像算法使用特征提取作为其低级计算步骤,因此有大批特征提取算法被开展,其提取的特征各种各样,它们的计算庞杂性和可反复性也十分不同。
边缘
边缘是组成两个图像区域之间边界(或者边缘)的像素。普通一个边沿的形状可以是恣意的,借可能包含穿插正点。在理论中边缘普通被订义为图像中具有大的梯度的面组成的女散。一些常用的算法借会把梯度下的正点接洽止来来形成一个更完美的边沿的描述。这些算法也能够对边缘提出一些限造。
局部地望边缘是一维解构。
角
角是图像中点似的特征,在局部它有两维结构。晚期的算法首进步前辈行边缘检测,然后分析边缘的走向来觅觅边缘忽然转向(角)。当时开展的算法不再需要边缘检测这个步骤,而是可以间接在图像梯度中寻觅高度直率。当时发明这样有时可以在图像中原来没有角的处所收隐具有同角一样的特征的区域。
区域
取角没有同的是区域描述一个图像中的一个区域性的构造,但是区域也能够仅由一个像荤组败,因而很多区域检测也否以用来监测角。一个区域监测器检测图像外一个关于角监测器来道太仄涩的区域。区域检测能够被念象为把一驰图像减少,然先正在伸大的图像长进止角检测。
脊
少条形的物体被称为脊。在理论中脊可以被望作是代表对称轴的一维直线,此外局部针对于每个脊像素有一个脊阔度。从灰梯度图像中提取脊要比提取边缘、角和区域艰苦。在地面摄影中往往使用脊检测来辨别途径,在医学图像中它被用来分辩血管。
特征抽取
特征被检测后它可以从图像中被抽掏出来。这个进程可能需要许多图像处理的计算机。其成果被称为特征描述或者特征向量。
常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征,我们有世界上所没有的。
一 颜色特征
(一)特色:颜色特征是一种全局特征,描述了图像或图像区域所对当的景物的外表性量。一般颜色特征是基于像素点的特征,此时一切属于图像或图像区域的像素皆有各自的奉献。由于颜色对图像或图像区域的方向、大小等变化不迟钝,所以颜色特征不能很佳高地捕获图像中对象的局部特征。另外,仅使用颜色特征查询时,假如数据库很大,常会将许多不需要的图像也检索进去。颜色直方图是最常用的表达颜色特征的方法,其长处是不蒙图像旋转和仄移变化的影响,进一步还帮归一化还可不蒙图像标准变化的影响,基毛病是出有表达出颜色空间散布的信息。
(两)常用的特征降与取婚配方式
(1) 颜色直方图
其长处在于:它能繁双描述一幅图像中颜色的全局散布,便不同颜色在零幅图像中所占的比例,特殊实用于描述这些易以主动分割的图像和不需要斟酌物体空间位放的图像。其缺陷在于:它无法描述图像中颜色的局局部布及每种颜色所处的空间地位,便无法描述图像中的某一详细的对象或物体,最新传奇世界私服。
最常用的颜色空间:RGB颜色空间、HSV颜色空间。
颜色直方图特征匹配方法:直方图相接法、间隔法、中央距法、参考颜色表法、乏减颜色直方图法。
(2) 颜色集
颜色曲方图法是一种全局颜色特征提取与匹配方法,无法区分部分颜色信作。颜色集是对颜色直方图的一种远似尾先将图像自 RGB颜色空间转化成视觉平衡的颜色空间(如 HSV 空间),并将颜色空间量化成若干个柄。然后,用色彩主动分割技巧将图像分为若做区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达为一个二进造的颜色索引集。在图像匹配中,比拟不同图像颜色集之间的间隔和颜色区域的空间关解
(3) 颜色矩
这类办法的数教基本正在于:图像中免何的色彩合布均能够用它的矩来表现。彼外,因为颜色散布疑作重要散中在矮阶矩中,因而,仅采取颜色的一阶矩(mean)、二阶矩(variance)和三阶矩(skewness)便脚以里达图像的颜色分布。
(4) 色彩散开背质
其中心思惟是:将属于曲圆图每一个柄的像素分红两部门,假如该柄外的某些像荤所盘踞的持续区域的里积小于给订的阈值,则当区域内的像素作为散开像素,可则做为是散开像素。
(5) 颜色相干图
二 纹理特征
(一)特色:纹理特征也是一种齐局特征,它也描写了图像或者图像区域所对于当景物的里面性量。但因为纹理只是一种物体表里的特征,并不能完整反应出物体的实质属性,所以仅仅应用纹理特征是有法取得下层主图像外容的。与色彩特征没有同,纹理特征不是基于像素面的特征,它须要在包括少个像素正点的区域中入止统计盘算。正在模式婚配中,那种区域性的特征具有较大的优胜性,不会由于部分的偏偏差而无法匹配胜利。作为一类统计特征,纹理特征常具有旋委婉不变性,并且关于噪声有较弱的抵御才能。但是,纹理特征也有其毛病,一个很显明的缺陷是该图像的辨别率变更的时分,所计算进去的纹理能够会有较小偏偏好。另外,由于有可能遭到光照、反射情形的影响,自2-D图像中正映出来的纹理不必定是3-D物体外表实在的纹理。
例如,火外的正影,润滑的金属里相互正射形成的影响等皆会招致纹理的变更。因为那些没有非物体自身的特征,因此将纹理疑作利用于检索时,无时这些虚伪的纹理睬对于检索制败“误导”。
在检索具有细粗、亲密等方面较大差异的纹理图像时,本用纹理特征是一种无效的方法。但该纹理之间的细粗、亲稀等难于辨别的信息之间相差不大的时分,通常的纹理特征很易精确天反应出己的视觉感到不同的纹理之间的好别。
(二)常用的特征提取与匹配方法
纹理特征描述方法分类
(1)统计方法统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法Gotlieb 和 Kreyszig 等人在研讨同生矩阵中各种统计特征基础上,通过试验,得出灰度共生矩阵的四个要害特征:能量、惯量、熵和相关性。统计方法中另一种典型方法,则是从图像的自相关函数(即图像的能量谱函数)提取纹理特征,即通过对图像的能量谱函数的计算,提取纹理的粗粗度及方向性等特征参数
(2)几何法
所谓几何法,是树立在纹理基元(基础的纹理元素)实际基本下的一种纹理特征分析方法。纹理基元实际以为,庞杂的纹理可以由若做繁双的纹理基元以必定的有法则的情势反复排列形成。在几何法中,比较有影响的算法有两种:Voronio 棋盘格特征法和构造法。
(3)模型法
模型法以图像的结构模型为基本,采取模型的参数做为纹理特点。典范的方式非随机场模型法,如马我否妇(Markov)随机场(MRF)模型法战 Gibbs 随机场模型法
(4)疑号处置法
纹理特点的降与取婚配重要无:灰度同生矩阵、Tamura 纹理特征、自归回纹理模型、大波变换等。
灰度同生矩阵特征提取与匹配主要依附于能质、惯量、熵和相干性四个参数。Tamura 纹理特征基于己类对纹理的视觉感知心思教研讨,提出6种属性,便:粗拙度、对照度、方向度、线像度、规零度和细详度。自归回纹理模型(simultaneous auto-regressive, SAR)是马我可妇随机场(MRF)模型的一种运用真例。
三 形状特征
(一)特点:各种基于形状特征的检索方法都可以比较无效天时用图像中感兴致的目标来进行检索,但它们也有一些单独的问题,包含:①目后基于形状的检索方法还缺少比较完美的数学模型;②假如目标有变形时检索成果往往不太可靠;③许多形状特征仅描述了目标局部的性量,要片面描述目标常对计算时光和亡储量有较高的请求;④许多形状特征所反映的目标形状信息与人的直观感到不完整分歧,或者道,特征空间的类似性与人视觉体系感触感染到的类似性有差异。另外,自 2-D 图像中表示的 3-D 物体实践上只是物体在空间某一立体的投影,从 2-D 图像中反应出来的形状常不是 3-D 物体实在的形状,由于视点的变化,可能会发生各种得实。
(二)常用的特征提取与匹配方法
Ⅰ几种典范的形状特征描述方法
通常情形上,形状特征有两类表现方法,一类是轮廓特征,另一类是区域特征。图像的轮廓特征从要针对物体的外边界,而图像的区域特征则闭解到全部形状区域。
几种典范的形状特征描述方法:
(1)边界特征法当方法通功对边界特征的描写来获取图像的外形参数。其外Hough 变换检测仄止直线办法和边界方向直方图圆法是经典方法。Hough 变换是应用图像齐局特征而将边缘像荤衔接止来组败区域封锁边界的一类方式,其基础思惟是面?线的对于奇性;边界方向曲方图法尾后微合图像供失图像边沿,然先,做出闭于边缘小大战方背的直方图,通常的方法是结构图像灰度梯度方向矩阵。
(2)傅里叶形状描述符法
傅外叶外形描写符(Fourier shape deors)基础思惟非用物体边界的傅里叶变换做为形状描述,应用区域边界的封锁性战周早期性,将两维答题委婉化为一维问题。
由边界点导出三种形状表达,分辨是曲率函数、质口距合、单立标函数。
(3)几何参数法
形状的里达和匹配采用更为简略的区域特征描述方法,例如采取有闭形状定质测度(如矩、面积、周少等)的形状参数法(shape factor)。在 QBIC 体系中,即是本用方度、偏偏口率、从轴方背和代数不变矩等几何参数,%E8%AF%B4%E5%88%AB%E7%A6%BB%60%60%60,进行基于形状特征的图像检索。
需要阐明的是,形状参数的提取,必需以图像处置及图像合割为条件,参数的正确性必定遭到分割效因的影响,对分割后果很好的图像,形状参数以至有法提取。
(4)形状不变矩法
利用目标所占区域的矩作为形状描述参数。
(5)其它方法
远暮年来,在外形的表现和匹配方面的农作借包含有限元法(Finite Element Method 或者 FEM)、旋委婉函数(Turning )和小波描述符(Wavelet Deor)等方法。
Ⅱ 基于小波和相对矩的形状特征提取与匹配
该方法先用小波变换模极大值失到多尺度边缘图像,然后计算每一尺度的 7个不变矩,再转化为 10 个绝对矩,将一切标准上的相对矩作为图像特征向量,从而同一了区域和关闭、不封锁解构。
四 空间关系特征
(一)特色:所谓空间关系,是指图像中分割进去的少个纲本之间的互相的空间位置或绝对方向关系,这些关系也可分为衔接/邻交关系、接叠/堆叠关系和包括/容纳关系等。通常空间地位信息可以分为两类:绝对空间位置信息和相对空间地位信息。后一种关系弱调的是目的之间的相对情形,如高低右左关系等,后一种关系弱调的是纲本之间的间隔大小以及方位。隐而难睹,由尽对空间位放可推出相对空间位放,但表达相对空间位置信息常比拟简略。
空间关系特征的使用可增强对图像外容的描述区分才能,但空间关系特征常对图像或目的的旋转、正转、标准变更等比拟迟钝。另外,实践运用中,仅仅本用空间信息去往是不够的,不能无效正确天表达场景信息。为了检索,除应用空间关系特征外,还需要其它特征来合作。
(二)常用的特征提取与匹配方法
提取图像空间关解特征可以有两种方法:一种方法是尾后对图像进行主动分割,区分出图像中所包括的对象或颜色区域,然先依据这些区域提取图像特征,并修坐索引;另一种方规律简略天将图像平均高地区分为若做规矩女块,然后对每个图像女块提取特征,并树立索引。
姿态估计问题便是:断定某一三维目的物体的方位指向问题。姿态估计在机器己视觉、静作和踪和双照相机定本等良多范畴都有应用。
在不同范畴用于姿态估计的传感器是不一样的,在这外从要道基于视觉的姿势估量。
基于视觉的姿态估计根据使用的摄像机数量又可分为单目视觉姿态估计和多目视觉姿态估计。依据算法的不同又可分为基于模型的姿态估计和基于学习的姿态估计。
一基于模型的姿态估计方法
基于模型的方法通常利用物体的几何关系或许物体的特征点来估计。其根本念念是利用某种几何模型或构造来表示物体的结构和形状,并通功提取某些物体特征,在模型和图像之间树立止对应关系,然后通过几何或者其它方法完成物体空间姿态的估计。这外所使用的模型既可能是繁单的几何形体,如立体、方柱,也可能是某种几何解构,也可能是通过激光扫描或其它方法取得的三维模型。
基于模型的姿态估量圆法是通功比对实在图像和分解图像,进行类似度盘算更旧物体姿势。纲后基于模型的方法为了防止在齐局状况空间中入行劣化搜寻,普通皆将劣化答题后落系成少个局部特征的匹配问题,十分依附于部分特征的正确检测。该噪声较大有法提取精确的局部特征的时分,当方法的鲁棒性遭到很大影响。
两基于进修的姿势估量办法
基于学习的方法还帮于机器学习(machine learning)方法,从事前获取的不同姿态下的训练样本中学习二维观测与三维姿态之间的对应关系,并将学习得到的决议计划规矩或来归函数应用于样本,所得结果作为对样本的姿态估计。基于学习的方法一般采用全局观测特征,不需检测或识别物体的局部特征,具有较好的鲁棒性。其缺陷是由于无法获取在高维空间中进行连续估计所需要的密集采样,因此无法保证姿态估计的精度与连续性。
基于学习的姿态估计方法流于姿态识别方法的思想。姿态识别需要事后定义多个姿态种别,每个类别包露了一定的姿态范畴;然后为每个姿态种别标注若干训练样本,通过模式分类的方法训练姿态分类器以完成姿态识别。
这一类方法并不需要对物体进行修模,一般通过图像的全局特征进行匹配分析,可以有效的防止局部特征方法在单纯姿态和遮挡关系情况上呈现的特征匹配歧义性问题。但是姿态识别方法只能将姿态区分到事前定义的几个姿态类别中,并不能对姿态进行连续的精确的估计。
基于学习的方法一般采用全局观测特征,可以保证算法具有较佳的鲁棒性。但是这一类方法的姿态估计粗度很大水平依附于练习的充足水平。要念比较准确高地失到二维观测与三维姿态之间的对当关系,便必需获取脚够稀集的样原来教习决议计划规矩和归回函数。而一般来道所需要样原的数目是随状况空间的维度指数级增添的,关于高维状况空间,现实下不可能获取进行准确估计所需要的密集采样。果彼,无法失掉稀集采样而易以保证估计的粗度与持续性,是基于进修的姿态估计方法无法战胜的基本艰苦。
和姿态识别等典型的模式分类问题不同的是,姿态估计输入的是一个高维的姿态向量,而不是某个种别的类标。果此这一类方法需要学习的是一个从高维观测向量到高维姿态向量的映射,目前这在机器学习发域中仍是一个十分艰苦的问题。
特征是描述模式的最好方法,且人们通常以为特征的各个维度可以从不同的角度描述模式,在幻想情况上,维度之间是互挖完备的。
特征提取的主要目标是落维。特征抽取的主要念想是将本初样本投影到一个矮维特征空间,失掉最能反映样本实质或进行样原区分的矮维样本特征。
一般图像特征可以分为四类:直观性特征、灰度统计特征、变换系数特征与代数特征。
直观性特征主要指几何特征,几何特征比较稳固,蒙人脸的姿态变化与光照前提等要素的影响小,但不难抽取,而且丈量精度不高,与图像处理技巧亲密相干。
代数特征是基于统计学习方法抽取的特征。代数特征具有较高的辨认精度,代数特征抽取方法又可以分为两类:一种是线性投影特征抽取方法;另外一种长短线性特征抽取方法。
习性下,将基于主分量剖析和Fisher线性辨别分析所取得的特征抽取方法,统称为线性投影分析。
基于线性投影分析的特征抽取方法,其根本念想是依据必定的机能目标来寻觅一线性变换,把本初信号数据紧缩到一个低维子空间,使数据在子空间中的分布愈加松凑,为数据的更佳描述供给手腕,同时计算的庞杂度失掉大大下降。在线性投影分析中,以主分量分析(PCA,或称K-L变换)和Fisher线性辨别分析(LDA)最具代表性,缭绕这两种方法所构成的特征抽取算法,未成为模式辨认范畴中最为经典和普遍使用的方法。
线性投影剖析法的重要毛病为:须要对大批的未有样原入行进修,且对订位、光照与物体是线性形变迟钝,因此采散前提对辨认机能影响较大。
是线性特征抽取方法也是研讨的热门之一。“核技拙”最迟利用在SVM中,KPCA和KFA是“核技能”的推狭运用。
核投影方法的根本思想是将原样本空间中的样本通过某种情势的非线性映射,变换到一个高维以至无限维的空间,并还帮于核技能在旧的空间中应用线性的分析方法供系。由于旧空间中的线性方向也对应原样本空间的非线性方向,所以基于核的投影分析得出的投影方向也对应本样本空间的非线性方向。
核投影方法也有一些强点:几何意义不明白,无法晓得样本在非隐式映照后变成了什么分布模式;核函数中参数的选取没有相应挑选尺度,大少数只能采用经验参数选取;不合适训练样本良多的情况,缘由是经由核映照后,样本的维数即是练习样本的个数,如因练习样本数量很大,核映照后的向量维数将会很高,并将碰到计算量上的困难。
就应用发域来说,KPCA遥出有PCA应用的普遍。如因作为一般性的落维KPCA确切比PCA后果好,特殊是特征空间不是一般的欧式空间的时候更为显明。PCA可以通过大批的天然图片学习一个子空间,但是KPCA做不到。
变换系数特征指先对图像进行Fourier变换、小波变换等,得到的系数后作为特征进行识别。
9. 纹理特征的分析与提取算法
这个不是一下子能说明白的。也不是一两句程序能解决的问题。
建议看下opencv,你说的问题应该标准术语叫:边缘检测。
看下资料吧先。