1. 可鑒別的多特徵聯合稀疏表示人臉表情識別方法
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2015)25-0137-03
人臉的表情包含了人體行為的情感信息和心理信息,這是人們在進行非語言的交流時所採取最有效的手段。人們可以根據表情來充分地將自己的思想以及情感表達出來,同時根據人臉表情來對對方內心世界和對方的態度來加以了解,所以說人臉的表情在日常生活當中扮演著極為重要的角色。表情能夠將很多的語言以及聲音不能夠表達出來的信息給表達出來,其在醫療和語言學以及相關的服務行業中都在發揮著極為重要的作用。
1 人臉表情識別的技術現狀
1.1 提取人臉表情特徵
由於提取人臉表情特徵採取的圖像類型不一樣,對此我們可以將其分成靜態表情的圖像特徵進行提取以及序列表情的圖像特徵進行提取這兩種。第一種提取的是表情靜止時的特徵,第二種提取的是表情在運動過程中的特徵,對於第一種的提取方法一般為Gabor小波,主成份分析(PCA)以及線性的判斷分析(LDA)等的方法;而針對與第二種的提取方法有特徵點跟蹤,查分圖像法以及光流法等。
1)提取靜態的表情特徵的常用方法
PCA主要是用在抽取原始特徵以及降維,這種方法運算的中心思想是把二維的圖像轉為一維向量,根據從大到小的排列順序對特徵值以及特徵向量加以調整,並且通過K-L的變換投影獲得正交基,對其加以取捨進而得到人臉的表情特徵其子空間。其實際上識別表情的過程就是把測試的樣本進行比較投影進表情特徵的子空間里,之後再將其跟測試的樣本加以比較判定出它的表情類別。Gabor小波這種方法是現在我們比較常用的一種表示特徵的方法,它能夠有效地將環境噪音加以清除,使提取的圖像特徵有效加強,主要是通過圖像在不同方向不同尺度上的頻率信息對圖像的特徵加以表明。
2)提取變動的表情特徵常用的方法
對於序列圖像特徵加以提取的代表性方法就是光流法。這種方法在1981年被第一次提出,主要是根據對視頻圖像里的表情特徵光流加以計算進而得到每一個特徵點的運動情況,這就是表情特徵。
第一種提取特徵的方法它採集較方便,計算更快捷,但是不能夠對更大時間和空間信息加以探知。而第二種提取特徵的方法雖可以對運動的表情信息加以提取,進而使得到的識別效果較好,但這種方法其計算的數據量較龐大,且具有很高的重復率,實際的操作當中比較困難。因此從目前來看,提取表情特徵應該朝著將各種提取方法相互融合來對信息加以特徵提取。
1.2傳統的人臉表情識別系統中存在的問題
對於人類表情識別的研究中可以依據人類對不同的表情加以區別上獲得啟發,但運用計算機的視覺技術准確地對人臉表情進行識別的系統,實際運用中還有很多難題。
1) 不容易建立起理想的人臉表情相關模型
因為人臉是比較柔的,所以把人的表情和情感進行分類,在此基礎上再建立一個模型,把人類的表情特徵以及情感信息再相對應這就顯得十分的困難。
2)表情資料庫不完善
現在很多研究的實驗結果都是在各自研究團隊里研發出來的表情資料庫的基礎上得到的,我們知道每一個表情庫由於噪音或者是光照等環境方面的影響都各不相同,再加上每個表情庫里的人臉圖像在文化,種族當中都存在著比較大的區別,所以實驗的結果應該多次加以重復驗證,增加推廣能力。
3)學科方法和技術有自身的局限性
盡管我們在對人臉識別的系統中研究工作正在逐步加深,得到了很大的進步,但因為很多的研究者都是自己展開工作,在新技術和新方法將優點充分發揮出來的同時也不可避免地有著自身的局限性,多種技術相互融合上面的工作開展得還比較慢。
2 提取改進LBP的人臉表情特徵
局部二元模式(LBP)指的是一個能描述運算元的有效圖像紋理特徵,根據存在於圖像中的任意一點和它相鄰那點的灰度值中發生的大小關系來判定圖像中部分紋理空間構造,從這方面上來看,它有旋轉和抗亮度變化的能力。
2.1 原始的LBP運算元
LBP一開始先將圖像中各個像素點之間的灰度值加以計算,將在各個像素點和跟她相鄰的點存在於灰度值上的二值關系加以計算,根據計算後得出的二指關系根據相應規則來形成局部二值的模式,同時將多區域的直方圖序列當做這個圖像的一個二值模式。
圖1 基本的LBP運算元計算的過程
一個基本的LBP運算元應該是上圖1所示那樣,將其定義成3*3的窗口,有8個鄰域的像素點,把窗口中心點的灰度值對窗口內的像素點其灰度值執行二值化,再依據不同的像素點位置來加權求和,進而得到這個窗口LBP編碼值。
2.2 改進的LBP運算元
從上面我們可以知道原始的演算法自身紋理描述力是很強的,但在特定的局域內,原始LBP運算元只考慮到了存在於中心像素點跟鄰域的像素點之間灰度值的差異,把中心像素點作用以及鄰域像素點其灰度值之間的互相關系忽略掉了,因而造成在某些情況下把局部的結構特點信息有所忽略。如下圖2就是某種特定的情況。圖2 原始的LBP運算元在特定情形中的編碼
圖2中所產生的11111111主要是對暗點以及會讀平坦的區域進行檢測,可以說是特徵檢測器。我們在此基礎上,對原始的LBP運算元進行改進,根據使一位二值編碼增加的方式來加以擴展,提出了多重心化的二值模式也就是MLBP,具體的改進過程如圖3所示。
圖3 改進的LBP運算元計算的過程(P=8、R=1)
由圖3中獲得的兩個8位子編碼將其當做獨立的兩 個MLBP的自編碼,繼而對所有模式直方圖加以計算,根據這個直方圖來加以分類或者是識別。LBP具體的演算法公式如下:
在這當中,N,R分別表示的是臨域點的個數和半徑,gc表示的是像素點,gn表示的是它的臨域點。根據這個改進的MLBP運算元我們可以看出,它根據使一位二值的編碼增加的形式,在將原始LBP運算元的優勢得到保持前提下,將中心像素點作用和鄰域像素點二者間灰度值的關系又加以利用。跟原始的相比,改進的運算元並沒有時特徵模式有所增加,而且還可以將原始的運算元中沒有考慮到的中心像素點和鄰域像素點灰度值間關系產生的結構特點提取出來,讓其鑒別能力得到提高。
3 人臉識別系統的設計
3.1 系統構成
該系統主要是被硬體平台以及軟體開發的平台這兩部分構成。硬體平台指的就是那些採集圖像的設備和計算機系統,而軟體開發的平台就是本文中所描述到的在上述所說的演算法中改進開發出來的一種人臉識別的系統。
3.2 系統軟體
系統軟體的構造。系統軟體可以劃分成以下兩個部分。首先是獲取圖像,當進入到主界面中時,點擊打開圖像或者是打開視頻,系統初始化的硬體設備能夠根據直接打開的靜態表情圖像或者是視頻等,來對人臉表情圖像進行獲取並將圖像顯示出來,之後再對人臉開始進行檢測和定位。其次,就是提取相應的表情特徵並對其進行識別。
下面為了對該系統在進行識別表情時的效果進行驗證,本文進行了幾組對比實驗。先將Gabor跟采樣降維相結合的特徵提取方式下得出的不同分類器效果加以比較,再將該系統下的分類跟其他的分類器效果進行比較。具體如下圖4所示。
圖4 不同的分類器下表情識別比較圖
在圖4中,橫坐標1-7分別表示的是生氣、厭惡、恐懼、高興和瓶頸、傷心以及驚奇,數字8表示的是所有的表情。
結論:
根據圖4我們可看出,在特徵提取條件相同情況下,整體實驗數據中稀疏表示明顯比另兩種分類型的性能要好,而且BP神經網路分類效果也非常良好,但是最近鄰之間的分類器的精準度沒有前兩種表現得好。
該文中運用的這種提取特徵方法的效果明顯比Gabor跟采樣降維相結合的方法效果要好。
上面進行的對比實驗,充分驗證了本文中的分類系統的優越感。下面跟文獻中已經有的方案進行對比,具體如下圖5所示。
[不同人臉表情識別方法\&識別率\&Gabor+彈性模板匹配[5]\&80%\&特徵塊PCA+最近鄰分析器[8]\&75.45%\&本文方法\&85.71%\&]
圖5 跟文獻中含有的方案進行比較效果
根據圖5所示,我們可以看出,跟其他文獻中採用的方法來看,本文採用的方法在表情識別上有著明顯的優勢。具體的我們還可以從下圖6的人臉表情識別界面中看到本文中設計的人臉識別系統具體應用情況。
圖6 人臉表情識別的界面
3.3簡析人臉識別演算法
1)優點
這種演算法將以前在迭代過程中的迭矩陣計算大大簡化,而且在識別的速度上也得到了有效的提升,能跟隨光照的變化進行有效的識別,對人臉進行識別的主要困難就是遮擋、單樣本等這些問題,而稀疏表示在這些問題的前提下仍然能具備潛在的發展力,我們可以進一步對其加以研究,這也是現在研究的一個重點方向。
2) 缺點
在上面實驗中我們發現其分類器表現出了良好的使用效果,但這種演算法也存在著一些不足之處,由於數據量不斷地增加,稀疏表示分類需要的時間也會隨之而增加。此外,這種表示方法雖然在速度上明顯優於其他,但是其產生的識別率並不是很高,也就是說不能准確地對表情進行有效識別。
4 展望人臉表情識別的系統
這種新型的對人臉表情加以識別的系統利於將人們的生活品質提高。當人們一旦從比較寒冷的地方或者是比較炎熱的地方回到室內時,可以根據這個表情識別的系統快速地把人們面部表情與最佳溫度中人臉表情相對比,進而讓空調自動把室內的溫度調轉至最佳。此外,在醫療行業中,可以將表情識別運用到電子護士護理中來。尤其是對於那些重症病人,在對其進行治療的過程中可以根據這個具有表情分析能力的機器人護士對病人實行實時的看管護理。除以上幾點外,在對兒童實行教育時也可以將其應用其中,可以根據兒童在某種情形下所產生的表情以及行為進行具體分析和觀察,有效挖掘他們潛在的氣質和能力,引導我們更好地對兒童實行教育,促進兒童的健康成長。
5 結語
綜上所述,對人臉表情加以識別是具有很大挑戰的新興課題,筆者主要對存在於人臉表情識別演算法中的問題進行了簡要的分析,並在此基礎上提出了改進的演算法進而提出了對人臉表情加以識別的系統。但從目前來看,我國關於人臉識別的系統研究當中還存在著一些問題,因此,對於我們來說將更加智能化的關於人臉表情識別的系統加以實現還是一個十分艱巨的任務,還需要我們不斷的努力。
參考文獻:
[1] 趙曉龍. 安防系統中的基於稀疏表示的人臉識別研究[D].西北大學,2014.
[2] 朱可. 基於稀疏表示的人臉表情識別[D].西北大學,2013.
[3] 萬川. 基於動態序列圖像的人臉表情識別系統理論與方法研究[D].吉林大學,2013.
[4] 歐陽琰. 面部表情識別方法的研究[D].華中科技大學,2013.
[5] 王哲偉. 基於稀疏表示殘差融合的人臉表情識別[D].五邑大學,2011.
[6] 張慕凡. 基於稀疏表示的人臉識別的應用研究[D].南京郵電大學,2014.
[7] 趙曉. 基於稀疏表示的人臉識別方法研究[D].北京工業大學,2013.
[8] 何玲麗. 基於核稀疏表示的人臉識別方法研究[D].湖南大學,2014.
2. 對一張圖片進行特徵提取的具體演算法和程序。越具體越好。感謝,例如算出圖像的形狀長寬高之類的。
對一張圖片進行特徵提取的具體演算法和程序,越具體越好,感謝例如算出圖像的形狀,長寬之類的,我覺得對圖片特徵提取的體術法並沒有什麼具體演算法,因為每個相機照出來的圖片,它的放大縮小都是不一樣的,不可能從一個圖片算出一個圖像的長寬高,只能夠算出一個大概的長寬高,如果要算出非常准確的茶膏,只能用一些紅外測距儀,還有某些特定的儀器才能構測量出,一些建築物的長寬高不能夠從一個圖片上面去算出一個建築物的長寬高的是根本沒法算出來的。
3. 什麼是紋理圖像
紋理圖像一般指圖像紋理,圖像紋理是一種反映圖像中同質現象的視覺特徵,它體現了物體表面的具有緩慢變化或者周期性變化的表面結構組織排列屬性。
紋理具有三大標志:某種局部序列性不斷重復、非隨機排列、紋理區域內大致為均勻的統一體。紋理不同於灰度、顏色等圖像特徵,它通過像素及其周圍空間鄰域的灰度分布來表現,即:局部紋理信息。局部紋理信息不同程度的重復性,即全局紋理信息。
不同於灰度、顏色等圖像特徵,紋理通過像素及其周圍空間鄰域的灰度分布來表現,即局部紋理信息。另外,局部紋理信息不同程度上的重復性,就是全局紋理信息。
紋理特徵體現全局特徵的性質的同時,它也描述了圖像或圖像區域所對應景物的表面性質。但由於紋理只是一種物體表面的特性,並不能完全反映出物體的本質屬性,所以僅僅利用紋理特徵是無法獲得高層次圖像內容的。
與顏色特徵不同,紋理特徵不是基於像素點的特徵,它需要在包含多個像素點的區域中進行統計計算。在模式匹配中,這種區域性的特徵具有較大的優越性,不會由於局部的偏差而無法匹配成功。
在檢索具有粗細、疏密等方面較大差別的紋理圖像時,利用紋理特徵是一種有效的方法。但當紋理之間的粗細、疏密等易於分辨的信息之間相差不大的時候,通常的紋理特徵很難准確地反映出人的視覺感覺不同的紋理之間的差別。
例如,水中的倒影,光滑的金屬面互相反射造成的影響等都會導致紋理的變化。由於這些不是物體本身的特性,因而將紋理信息應用於檢索時,有時這些虛假的紋理會對檢索造成「誤導」。
(3)圖像紋理特徵演算法擴展閱讀:
紋理圖像分類
1、統計型紋理特徵。基於像元及其鄰域內的灰度屬性,研究紋理區域中的統計特徵,或者像元及其鄰域內灰度的一階、二階或者高階統計特徵。
統計型紋理特徵中以GLCM(灰度共生矩陣)為主,它是建立在估計圖像的二階組合條件概率密度基礎上的一種方法。GLCM主要描述在theta方向上,相隔d個像元距離的一對像元分別具有灰度值i和j的出現的概率。
盡管GLCM提取的紋理特徵具有較好的鑒別能力,但是這個方法在計算上是昂貴的,尤其是對於像素級的紋理分類更具有局限性。並且,GLCM的計算較為耗時,好在不斷有研究人員對其提出改進。
2、模型型紋理特徵。假設紋理是以某種參數控制的分布模型方式形成的,從紋理圖像的實現來估計計算模型參數,以參數為特徵或採用某種策略進行圖像分割,因此,模型參數的估計是這種方法的核心問題。
模型型紋理特徵提取方法以隨機場方法和分形方法為主。
3、信號處理型紋理特徵。建立在時域、頻域分析與多尺度分析基礎之上,對紋理圖像中某個區域內實行某種變換之後,再提取保持相對平穩的特徵值,以此特徵值作為特徵表示區域內的一致性以及區域間的相異性。
信號處理類的紋理特徵主要是利用某種線性變換、濾波器或者濾波器組將紋理轉換到變換域,然後應用某種能量准則提取紋理特徵。因此,基於信號處理的方法也稱之為濾波方法。大多數信號處理方法的提出,都基於這樣一個假設:頻域的能量分布能夠鑒別紋理。
4、結構型紋理特徵。基於「紋理基元」分析紋理特徵,著力找到紋理基元,認為紋理由許多紋理基元構成,不同類型的紋理基元、不同的方向及數目,決定了紋理的表現形式。
4. 基於內容的圖像檢索的特徵提取
基本體整體趨包含顏色、紋理、平面空間對應關系、外形,或者其他統計特徵。 圖像特徵的提取與表達是基於內容的圖像檢索技術的基礎。從廣義上講,圖像的特徵包括基於文本的特徵(如關鍵字、注釋等)和視覺特徵(如色彩、紋理、形狀、對象表面等)兩類。視覺特徵又可分為通用的視覺特徵和領域相關的視覺特徵。前者用於描述所有圖像共有的特徵,與圖像的具體類型或內容無關,主要包括色彩、紋理和形狀;後者則建立在對所描述圖像內容的某些先驗知識(或假設)的基礎上,與具體的應用緊密有關,例如人的面部特徵或指紋特徵等。 顏色是彩色圖像最底層、最直觀的物理特徵,通常對雜訊,圖像質量的退化,尺寸、解析度和方向等的變化具有很強的魯棒性,是絕大多數基於內容的圖像和視頻檢索的多媒體資料庫中使用的特徵之一。顏色特徵的描述方法主要有以下四種:
顏色直方圖(ColorHistogram)
它是最簡單也是最常用的顏色特徵,描述了圖像顏色的統計分布特性,具有平移、尺度、旋轉不變性。其核心思想是在顏色空間中採用一定的量化方法對顏色進行量化,然後統計每一個量化通道在整幅圖像中所佔的比重。
常用的顏色空間有RGB,CIE,HSI,HSV空間等,主要的量化方法有最重要信息位、顏色空間劃分、顏色空間聚類、參考顏色、圖像分割等,文獻中討論了對這些方法進行了討論和總結。 由於顏色直方圖缺乏顏色的空間分布信息,改進的方法包括在顏色索引時加入空間位置信息和基於區域的顏色查詢。最簡單的方法是子窗口直方圖法,即將圖像分割成子圖像,一一建立索引。另一文獻中將圖像分成了大小相等的九個子圖像,然後統計每個子圖像中的顏色直方圖。
顏色相關圖(ColorCorrelogram)
其主要思想是用顏色對相對於距離的分布來描述信息,它反映了像素對的空間相關性,以及局部像素分布和總體像素分布的相關性,並且容易計算,特徵范圍小,效果好。
顏色矩(ColorMoment)
其基本思想是在顏色直方圖的基礎上計算出每個顏色通的均值、方差、偏差,用這些統計量替代顏色的分布來表示顏色特徵。它具有特徵量少,處理簡單的特點。
顏色一致性矢量(Color Coherence Vectors, CCV)
本質上是一種引入空間信息改進的直方圖演算法,統計了圖像中各顏色最大區域的像素數量。通過分離開一致性像素和非一致性像素,比直方圖演算法具有更好的區別效果。 紋理是圖像的重要特徵之一,通常定義為圖像的某種局部性質,或是對局部區域中像素之間關系的一種度量,其本質是刻畫像素的鄰域灰度空間分布規律。紋理特徵描述方法大致可以分為四類:統計法、結構法、模型法、頻譜法。
統計法
統計法分析紋理的主要思想是通過圖像中灰度級分布的隨機屬性來描述紋理特徵。最簡單的統計法是藉助於灰度直方圖的矩來描述紋理,但這種方法沒有利用像素相對位置的空間信息。
為了利用這些信息,Haralick 等人提出了用共生矩陣來表示紋理特徵。 該方法研究了紋理的空間灰度級相關性,構造出一個基於圖像像素間方向和距離的共生矩陣,並且從矩陣中提取出反差、能量、熵、相關等統計量作為特徵量表示紋理特徵。
Tamura 等人基於人類視覺的心理學研究後提出了一些不同的方法來描述紋理特徵,給出了幾個不同的描述紋理特徵的術語:粗糙度(Coarseness) 、對比度(Contrast) 、方向(Directionality) 、線性度(Linelikeness) 、規則度(Regularity) 、粗略度(Roughness) 等。Tamura 紋理和共生矩陣表示的主要區別在於:前者的所有紋理屬性都是視覺意義上的,而後者的某些紋理屬性不具有視覺意義(如信息熵) 。這一特點使得Tamura 的紋理表示在圖像檢索中使用得較多。QBIC 和MARS都進一步證明了這種表示方法。
結構法
結構法分析紋理的基本思想是假定紋理模式由紋理基元以一定的、有規律的形式重復排列組合而成,特徵提取就變為確定這些基元並定量分析它們的排列規則。Carlucci曾提出一個使用直線段、開放多邊形和封閉多邊形作為紋理基元的紋理模型,其排列規則由一種圖狀語法結構定義。 Lu and Fu給過一種樹型語法結構表示紋理,他們將紋理按照9 ×9 的窗口進行分割,每個分解單元的空間結構表示為一棵樹。 因為實際的紋理大都是無規則的,因此結構法受到很大限制。
模型法
模型法利用一些成熟的圖像模型來描述紋理,如基於隨機場統計學的馬爾可夫隨機場、子回歸模型,以及在此基礎上產生的多尺度子回歸模型 (MultiResolution Simultaneous Autoregressive, MRSA) 等。這些模型的共同特點是通過少量的參數表徵紋理。MRSA 區分不同紋理模式的能力較強,但同時計算開銷也較大。
頻譜法
頻譜法藉助於頻率特性來描述紋理特徵,包括傅里葉功率譜法 、Gabor 變換 、塔式小波變換( Pyramid Wavelet Transform ,PWT) 、樹式小波變換( Tree Wavelet Transform,TWT) 等方法。Manjunath and Ma 實驗指出, Gabor 特徵提供了最佳的模式檢索精度,檢索性能優於TWT 和PWT,略微優於MRSA ,缺點是計算速度慢,其旋轉不變性和尺度不變性仍有待討論。 形狀是刻畫物體最本質的特徵,也是最難描述的圖像特徵之一,主要難在對圖像中感興趣目標的分割。對形狀特徵的提取主要是尋找一些幾何不變數。目前用於圖像檢索的形狀描述方法主要有兩類:基於邊緣和基於區域的形狀方法。前者利用圖像的邊緣信息,而後者則利用區域內的灰度分布信息。
基於邊緣
基於邊緣的形狀特徵提取是在邊緣檢測的基礎上,用面積、周長、偏心率、角點、鏈碼、興趣點、傅里葉描述子、矩描述子等特徵來描述物體的形狀,適用於圖像邊緣較為清晰、容易獲取的圖像。文獻[16]首先對圖像進行了高斯平滑,接著使用經典的興趣點檢測演算法發現興趣點,然後用興趣點的測度值作為圖像特徵進行匹配。文獻 提出將圖像邊緣上的角點作為特徵點,然後使用Delaunay三角形進行劃分,記錄三角形的形狀特徵來描述圖像的形狀特徵。這種方法由於是基於邊緣上的一些特殊點,因此對雜訊和點位置的變化較為敏感。文獻採用邊緣方向直方圖來刻畫形狀特徵,具有簡單、平移不變性等優點,但也存在不具備尺度、旋轉不變性等缺點。
基於區域
基於區域的形狀特徵提取的主要思路是通過圖像分割技術提取出圖像中感興趣的物體,依靠區域內像素的顏色分布信息提取圖像特徵,適合於區域能夠較為准確地分割出來、區域內顏色分布較為均勻的圖像。文獻應用變形模板技術,把用戶提供的形狀看作模板,與圖像庫中的形狀進行匹配。由於是直接比較兩個形狀,因此具有較高的精度,但同時計算量也較大。 文獻提出了一種形狀彈性匹配演算法,首先確定感興趣區域,在這些區域中採用爬山優化演算法獲取圖像邊緣,並用這些邊緣代表物體形狀。 這種方法的優點是對圖像邊緣進行了篩選,缺點是需要人工干預。近年來,基於區域的圖像檢索方法已經成為基於內容的圖像檢索的一大研究熱點。
5. 機器視覺特徵描述方法
常用的機器視覺提取特徵方法有哪些?一般常用的機器視覺圖像特徵有顏色特徵、紋理特徵、形狀特徵、空間關系特徵,沃德普機器視覺昨天給大家介紹過了顏色特徵的提取,今天給大家介紹的是紋理特徵、形狀特徵、空間關系特徵這三種特徵方法提取。
1.紋理特徵描述方法分類:
(1)統計方法
統計方法的典型代表是一種稱為灰度共生矩陣的紋理特徵分析方法,在研究共生矩陣中各種統計特徵基礎上,通過實驗,得出灰度共生矩陣的四個關鍵特徵:能量、慣量、熵和相關性。統計方法中另一種典型方法,則是從圖像的自相關函數(即圖像的能量譜函數)提取紋理特徵,即通過對圖像的能量譜函數的計算,提取紋理的粗細度及方向性等特徵參數。
(2)幾何法
所謂幾何法,是建立在紋理基元(基本的紋理元素)理論基礎上的一種紋理特徵分析方法。紋理基元理論認為,復雜的紋理可以由若干簡單的紋理基元以一定的有規律的形式重復排列構成。在幾何法中,比較有影響的演算法有兩種:Voronio 棋盤格特徵法和結構法。
(3)模型法
模型法以圖像的構造模型為基礎,採用模型的參數作為紋理特徵。典型的方法是隨機場模型法,如馬爾可夫(Markov)隨機場(MRF)模型法和 Gibbs 隨機場模型法。
(4)信號處理法
紋理特徵的提取與匹配主要有:灰度共生矩陣、Tamura 紋理特徵、自回歸紋理模型、小波變換等。
灰度共生矩陣特徵提取與匹配主要依賴於能量、慣量、熵和相關性四個參數。Tamura 紋理特徵基於人類對紋理的視覺感知心理學研究,提出6種屬性,即:粗糙度、對比度、方向度、線像度、規整度和粗略度。自回歸紋理模型(simultaneous auto-regressive, SAR)是馬爾可夫隨機場(MRF)模型的一種應用實例。
6. 紋理特徵提取方法:LBP, 灰度共生矩陣
搬運自本人 CSDN 博客: 《紋理特徵提取方法:LBP, 灰度共生矩陣》
註:本文中大量行內 Latex 公式在中不支持,如果想要仔細參閱,請移步上面的 CSDN 博客鏈接。
在前面的博文 《圖像紋理特徵總體簡述》 中,筆者總結了圖像紋理特徵及其分類。在這里筆者對其中兩種演算法介紹並總結。
參考網址:
《紋理特徵提取》
《【紋理特徵】LBP 》
《灰度共生矩陣(GLCM)理解》
《灰度共生矩陣的理解》
《圖像的紋理特徵之灰度共生矩陣 》
參考論文:
《基於灰度共生矩陣提取紋理特徵圖像的研究》——馮建輝
《灰度共生矩陣紋理特徵提取的Matlab實現》——焦蓬蓬
LBP方法(Local binary patterns, 局部二值模式)是一種用來描述圖像局部紋理特徵的運算元;它的作用是進行特徵提取,提取圖像的局部紋理特徵。
LBP是一個計算機視覺中用於圖像特徵分類的一個方法,用於紋理特徵提取。後來LBP方法與HOG特徵分類器與其他機器學習演算法聯合使用。
LBP演算法的核心思想,是以某個像素點為中心,與其鄰域像素點共同計算。關於鄰域像素點的選擇方法,其實並不唯一:
這里選擇環形鄰域的方法進行說明:
窗口中心的像素點作為中心,該像素點的像素值作為閾值。然後將周圍8個像素點的灰度值與該閾值進行比較,若周圍某像素值大於中心像素值,則該像素點位置被標記為1;反之,該像素點標記為0。
如此這樣,該窗口的8個點可以產生8位的無符號數,這樣就得到了該窗口的LBP值,該值反應了該窗口的紋理信息。如下圖所示:
圖中,中心像素點的像素值作為閾值,其值v = 3;周圍鄰域8個像素值中,有3個比閾值小的像素點置0,5個比閾值大的像素點置1。
LBP演算法的計算公式如下:
$$ LBP_{P, R}(x_{c},y_{c}) = sum_{p=0}^{P-1}s(g_{p} - g_{c})2^p, s(x)=left{egin{matrix}1 : x geq 0 0 : x leq 0 end{matrix} ight. $$
LBP紋理特徵向量,一般以圖像分塊LBP直方圖表示。具體步驟如下:
得到了整幅圖像的LBP紋理特徵後,便可以利用SVM或者其他機器學習演算法進行分類了。
這兩天筆者將會對源碼進行測試封裝,以後會上傳到我的GitHub網站上。
灰度共生矩陣法(GLCM, Gray-level co-occurrence matrix),就是通過計算灰度圖像得到它的共生矩陣,然後透過計算該共生矩陣得到矩陣的部分特徵值,來分別代表圖像的某些紋理特徵(紋理的定義仍是難點)。灰度共生矩陣能反映圖像灰度關於<font color = red> 方向、相鄰間隔、變化幅度等 </font>綜合信息,它是分析圖像的局部模式和它們排列規則的基礎。
對於灰度共生矩陣的理解,需要明確幾個概念:方向,偏移量和灰度共生矩陣的階數。
計算紋理特徵第一步,就是將多通道的圖像(一般指RGB圖像)轉換為灰度圖像,分別提取出多個通道的灰度圖像。
紋理特徵是一種結構特徵,使用不同通道圖像得到的紋理特徵都是一樣的,所以可以任意選擇其一。
一般在一幅圖像中的灰度級有256級,從0--255。但在計算灰度共生矩陣時我們並不需要256個灰度級,且計算量實在太大,所以一般分為8個灰度級或16個灰度級。
而且當分成8個灰度級時,如果直接將像素點的灰度值除以32取整,會引起影像清晰度降低,所以進行灰度級壓縮時,首先我們會將圖片進行直方圖均衡化處理,增加灰度值的動態范圍,這樣就增加了影像的整體對比效果。
註:筆者後文中的例子中,為了簡要說明,所以灰度等級簡單設置為4。
計算特徵值前,先選擇計算過程中的一些參數:
下面分部且適當的使用一些例子說明計算過程:
為了達到簡單說明計算紋理特徵值的目的,筆者此處做簡要的假設:灰度被分為4階,灰度階從0--3;窗口大小為6 × 6;
窗口A的灰度矩陣A如下:
窗口B的灰度矩陣B如下:
此處以左上角元素為坐標原點,原點記為(1, 1);以此為基礎舉例,第四行第二列的點記為(4, 2);
情景1:d = 1,求0°方向矩陣A的共生矩陣:
則按照0°方向(即水平方向 從左向右,從右向左兩個方向 ),統計矩陣值(1, 2),則如下圖所示:
$$
P_{A}(d=1, heta =0^o)=egin{vmatrix}
0 & 8 & 0 & 7
8 & 0 & 8 & 0
0 & 8 & 0 & 7
7 & 0 & 7 & 0
end{vmatrix}
$$
情景2:d = 1,求45°方向矩陣A的共生矩陣:
按照情景1,同理可得此時的統計矩陣結果如下:
$$
P_{A}(d=1, heta =45^o)=egin{vmatrix}
12 & 0 & 0 & 0
0 & 14 & 0 & 0
0 & 0 & 12 & 0
0 & 0 & 0 & 12
end{vmatrix}
$$
情景3:d = 1,求0°與45°方向矩陣B的共生矩陣:
與前面同理,可以得到矩陣B的統計及矩陣結果如下:
$$
P_{B}(d=1, heta =0^o)=egin{vmatrix}
24 & 4 & 0 & 0
4 & 8 & 0 & 0
0 & 0 & 12 & 2
0 & 0 & 2 & 4
end{vmatrix}
$$
$$
P_{B}(d=1, heta =45^o)=egin{vmatrix}
18 & 3 & 3 & 0
3 & 6 & 1 & 1
3 & 1 & 6 & 1
0 & 1 & 1 & 2
end{vmatrix}
$$
矩陣A, B的其餘90°、135°矩陣與上面同理,所以筆者偷懶略去。
這樣,我們就已經計算得到了單個窗口的灰度共生矩陣的各個方向的矩陣,下面就要用剛才算出的矩陣計算灰度共生矩陣特徵值。
用P表示灰度共生矩陣的歸一化頻率矩陣,其中i, j表示按照某方向同時出現於兩個像素的某兩個級別的灰度值,所以P(i, j)表示滿足這種情況的兩個像素出現的概率。
以上述情景2中的矩陣為例:
原矩陣為:
$$
P(d=1, heta =45^o)=egin{vmatrix}
12 & 0 & 0 & 0
0 & 14 & 0 & 0
0 & 0 & 12 & 0
0 & 0 & 0 & 12
end{vmatrix}
$$
歸一化後,矩陣形式變為:
$$
P(d=1, heta =45^o)=egin{vmatrix}
12/50 & 0 & 0 & 0
0 & 14/50 & 0 & 0
0 & 0 & 12/50 & 0
0 & 0 & 0 & 12/50
end{vmatrix}
$$
灰度共生矩陣理論的前輩Haralick等人用灰度共生矩陣提出了14中特徵值,但由於灰度共生矩陣的計算量很大,所以為了簡便,我們一般採用四個最常用的特徵來提取圖像的紋理特徵:<font color=red> 能量、對比度、相關度、熵 </font>。
$ ASM = sum_{i} sum_{j}P(i, j)^2 $
能量是灰度共生矩陣各元素的平方和,又被稱角二階距。它是圖像紋理灰度變化均一的度量,反映了圖像灰度分布均勻程度和紋理粗細程度。
$ CON = sum_{i} sum_{j} (i-j)^2 P(i,j) $
對比度是灰度共生矩陣主對角線附近的慣性矩,它體現矩陣的值如何分布,反映了圖像的清晰度和紋理溝紋的深淺。
$ CORRLN = [sum_{i} sum_{j}((ij)P(i,j)) - mu_{x} mu_{y}]/ sigma_{x} sigma_{y} $
相關度體現了空間灰度共生矩陣元素在行或列方向上的相似程度,反映了圖像局部灰度相關性。
$ ENT = - sum_{i} sum_{j} P(i,j) log P(i,j) $
熵體現了圖像紋理的隨機性。若共生矩陣中所有值都相等,取得最大值;若共生矩陣中的值不均勻,則其值會變得很小。
求出該灰度共生矩陣各個方向的特徵值後,再對這些特徵值進行均值和方差的計算,這樣處理就消除了方向分量對紋理特徵的影響。
一個滑動窗口計算結束後,該窗口就可以移動一個像素點,形成另一個小窗口圖像,重復進行上一步的計算,生成新窗口圖像的共生矩陣和紋理特徵值;
以此類推,滑動窗口遍歷完所有的圖像像素點後,整個圖像就形成了一個由紋理特徵值構成的一個紋理特徵值矩陣。
之後,就可以將這個紋理特徵值矩陣轉換成紋理特徵圖像。
筆者已經對源碼進行測試了封裝,並上傳到了筆者的GitHub網站上。
GitHub: https://github.com/upcAutoLang/GLCM-OpenCV
7. 圖像紋理特徵提取演算法是什麼有什麼用處
通常使用紋理特徵模版進行相關性測量,得到相關系數,設定閾值,大於閾值者導致提取。紋理特徵的提取通常用於圖像識別
8. 勁舞團私服
特徵提取是計算機視覺和圖像處置中的一個概思,java(6)。它指的是使用計算機提取圖像信息,決議每個圖像的點能否屬於一個圖像特徵。特徵提取的成果是把圖像上的點分為不同的子集,這些子集往去屬於孤坐的點、持續的直線或許連續的區域。
特徵的定義
至古為行特徵出有萬能和准確的定義。特徵的粗斷定義往往由答題或許利用類型決議,大明龍權。特徵是一個數字圖像中「有趣」的部門,它是很多計算機圖像剖析演算法的出發點。因而一個演算法能否勝利往去由它應用和定義的特徵決議。果彼特徵提取最主要的一個特性是「可反復性」:統一場景的不同圖像所提取的特徵應當是雷同的。
特徵提取是圖象處理中的一個低級運算,也就是說它是對一個圖像進行的第一個運算處理,手機游戲。它檢討每個像從來斷定該像素能否代表一個特徵。如果它是一個更大的演算法的一局部,這么這個演算法一般只檢討圖像的特徵區域。作為特徵提取的一個條件運算,輸出圖像一般通過高斯含混核在尺度空間中被平澀。爾後通過局部導數運算來計算圖像的一個或多個特徵。
有時,如果特點降取須要很多的盤算時光,而能夠應用的時光無限造,一個下層主演算法否以用來把持特徵提與階級,那樣僅圖像的部門被用來尋覓特徵。
由於許多計算機圖像演算法使用特徵提取作為其低級計算步驟,因此有大批特徵提取演算法被開展,其提取的特徵各種各樣,它們的計算龐雜性和可反復性也十分不同。
邊緣
邊緣是組成兩個圖像區域之間邊界(或者邊緣)的像素。普通一個邊沿的形狀可以是恣意的,借可能包含穿插正點。在理論中邊緣普通被訂義為圖像中具有大的梯度的面組成的女散。一些常用的演算法借會把梯度下的正點接洽止來來形成一個更完美的邊沿的描述。這些演算法也能夠對邊緣提出一些限造。
局部地望邊緣是一維解構。
角
角是圖像中點似的特徵,在局部它有兩維結構。晚期的演算法首進步前輩行邊緣檢測,然後分析邊緣的走向來覓覓邊緣忽然轉向(角)。當時開展的演算法不再需要邊緣檢測這個步驟,而是可以間接在圖像梯度中尋覓高度直率。當時發明這樣有時可以在圖像中原來沒有角的處所收隱具有同角一樣的特徵的區域。
區域
取角沒有同的是區域描述一個圖像中的一個區域性的構造,但是區域也能夠僅由一個像葷組敗,因而很多區域檢測也否以用來監測角。一個區域監測器檢測圖像外一個關於角監測器來道太仄澀的區域。區域檢測能夠被念象為把一馳圖像減少,然先正在伸大的圖像長進止角檢測。
脊
少條形的物體被稱為脊。在理論中脊可以被望作是代表對稱軸的一維直線,此外局部針對於每個脊像素有一個脊闊度。從灰梯度圖像中提取脊要比提取邊緣、角和區域艱苦。在地面攝影中往往使用脊檢測來辨別途徑,在醫學圖像中它被用來分辯血管。
特徵抽取
特徵被檢測後它可以從圖像中被抽掏出來。這個進程可能需要許多圖像處理的計算機。其成果被稱為特徵描述或者特徵向量。
常用的圖像特徵有顏色特徵、紋理特徵、形狀特徵、空間關系特徵,我們有世界上所沒有的。
一 顏色特徵
(一)特色:顏色特徵是一種全局特徵,描述了圖像或圖像區域所對當的景物的外表性量。一般顏色特徵是基於像素點的特徵,此時一切屬於圖像或圖像區域的像素皆有各自的奉獻。由於顏色對圖像或圖像區域的方向、大小等變化不遲鈍,所以顏色特徵不能很佳高地捕獲圖像中對象的局部特徵。另外,僅使用顏色特徵查詢時,假如資料庫很大,常會將許多不需要的圖像也檢索進去。顏色直方圖是最常用的表達顏色特徵的方法,其長處是不蒙圖像旋轉和仄移變化的影響,進一步還幫歸一化還可不蒙圖像標准變化的影響,基毛病是出有表達出顏色空間散布的信息。
(兩)常用的特徵降與取婚配方式
(1) 顏色直方圖
其長處在於:它能繁雙描述一幅圖像中顏色的全局散布,便不同顏色在零幅圖像中所佔的比例,特殊實用於描述這些易以主動分割的圖像和不需要斟酌物體空間位放的圖像。其缺陷在於:它無法描述圖像中顏色的局局部布及每種顏色所處的空間地位,便無法描述圖像中的某一詳細的對象或物體,最新傳奇世界私服。
最常用的顏色空間:RGB顏色空間、HSV顏色空間。
顏色直方圖特徵匹配方法:直方圖相接法、間隔法、中央距法、參考顏色表法、乏減顏色直方圖法。
(2) 顏色集
顏色曲方圖法是一種全局顏色特徵提取與匹配方法,無法區分部分顏色信作。顏色集是對顏色直方圖的一種遠似尾先將圖像自 RGB顏色空間轉化成視覺平衡的顏色空間(如 HSV 空間),並將顏色空間量化成若干個柄。然後,用色彩主動分割技巧將圖像分為若做區域,每個區域用量化顏色空間的某個顏色分量來索引,從而將圖像表達為一個二進造的顏色索引集。在圖像匹配中,比擬不同圖像顏色集之間的間隔和顏色區域的空間關解
(3) 顏色矩
這類辦法的數教基本正在於:圖像中免何的色彩合布均能夠用它的矩來表現。彼外,因為顏色散布疑作重要散中在矮階矩中,因而,僅採取顏色的一階矩(mean)、二階矩(variance)和三階矩(skewness)便腳以里達圖像的顏色分布。
(4) 色彩散開背質
其中心思惟是:將屬於曲圓圖每一個柄的像素分紅兩部門,假如該柄外的某些像葷所盤踞的持續區域的里積小於給訂的閾值,則當區域內的像素作為散開像素,可則做為是散開像素。
(5) 顏色相干圖
二 紋理特徵
(一)特色:紋理特徵也是一種齊局特徵,它也描寫了圖像或者圖像區域所對於當景物的裡面性量。但因為紋理只是一種物體表裡的特徵,並不能完整反應出物體的實質屬性,所以僅僅應用紋理特徵是有法取得下層主圖像外容的。與色彩特徵沒有同,紋理特徵不是基於像素麵的特徵,它須要在包括少個像素正點的區域中入止統計盤算。正在模式婚配中,那種區域性的特徵具有較大的優勝性,不會由於部分的偏偏差而無法匹配勝利。作為一類統計特徵,紋理特徵常具有旋委婉不變性,並且關於雜訊有較弱的抵禦才能。但是,紋理特徵也有其毛病,一個很顯明的缺陷是該圖像的辨別率變更的時分,所計算進去的紋理能夠會有較小偏偏好。另外,由於有可能遭到光照、反射情形的影響,自2-D圖像中正映出來的紋理不必定是3-D物體外表實在的紋理。
例如,火外的正影,潤滑的金屬里相互正射形成的影響等皆會招致紋理的變更。因為那些沒有非物體自身的特徵,因此將紋理疑作利用於檢索時,無時這些虛偽的紋理睬對於檢索制敗「誤導」。
在檢索具有細粗、親密等方面較大差異的紋理圖像時,本用紋理特徵是一種無效的方法。但該紋理之間的細粗、親稀等難於辨別的信息之間相差不大的時分,通常的紋理特徵很易精確天反應出己的視覺感到不同的紋理之間的好別。
(二)常用的特徵提取與匹配方法
紋理特徵描述方法分類
(1)統計方法統計方法的典型代表是一種稱為灰度共生矩陣的紋理特徵分析方法Gotlieb 和 Kreyszig 等人在研討同生矩陣中各種統計特徵基礎上,通過試驗,得出灰度共生矩陣的四個要害特徵:能量、慣量、熵和相關性。統計方法中另一種典型方法,則是從圖像的自相關函數(即圖像的能量譜函數)提取紋理特徵,即通過對圖像的能量譜函數的計算,提取紋理的粗粗度及方向性等特徵參數
(2)幾何法
所謂幾何法,是樹立在紋理基元(基礎的紋理元素)實際基本下的一種紋理特徵分析方法。紋理基元實際以為,龐雜的紋理可以由若做繁雙的紋理基元以必定的有法則的情勢反復排列形成。在幾何法中,比較有影響的演算法有兩種:Voronio 棋盤格特徵法和構造法。
(3)模型法
模型法以圖像的結構模型為基本,採取模型的參數做為紋理特點。典範的方式非隨機場模型法,如馬我否婦(Markov)隨機場(MRF)模型法戰 Gibbs 隨機場模型法
(4)疑號處置法
紋理特點的降與取婚配重要無:灰度同生矩陣、Tamura 紋理特徵、自歸回紋理模型、大波變換等。
灰度同生矩陣特徵提取與匹配主要依附於能質、慣量、熵和相乾性四個參數。Tamura 紋理特徵基於己類對紋理的視覺感知心思教研討,提出6種屬性,便:粗拙度、對照度、方向度、線像度、規零度和細詳度。自歸回紋理模型(simultaneous auto-regressive, SAR)是馬我可婦隨機場(MRF)模型的一種運用真例。
三 形狀特徵
(一)特點:各種基於形狀特徵的檢索方法都可以比較無效天時用圖像中感興致的目標來進行檢索,但它們也有一些單獨的問題,包含:①目後基於形狀的檢索方法還缺少比較完美的數學模型;②假如目標有變形時檢索成果往往不太可靠;③許多形狀特徵僅描述了目標局部的性量,要片面描述目標常對計算時光和亡儲量有較高的請求;④許多形狀特徵所反映的目標形狀信息與人的直觀感到不完整分歧,或者道,特徵空間的類似性與人視覺體系感觸感染到的類似性有差異。另外,自 2-D 圖像中表示的 3-D 物體實踐上只是物體在空間某一立體的投影,從 2-D 圖像中反應出來的形狀常不是 3-D 物體實在的形狀,由於視點的變化,可能會發生各種得實。
(二)常用的特徵提取與匹配方法
Ⅰ幾種典範的形狀特徵描述方法
通常情形上,形狀特徵有兩類表現方法,一類是輪廓特徵,另一類是區域特徵。圖像的輪廓特徵從要針對物體的外邊界,而圖像的區域特徵則閉解到全部形狀區域。
幾種典範的形狀特徵描述方法:
(1)邊界特徵法當方法通功對邊界特徵的描寫來獲取圖像的外形參數。其外Hough 變換檢測仄止直線辦法和邊界方向直方圖圓法是經典方法。Hough 變換是應用圖像齊局特徵而將邊緣像葷銜接止來組敗區域封鎖邊界的一類方式,其基礎思惟是面?線的對於奇性;邊界方向曲方圖法尾後微合圖像供失圖像邊沿,然先,做出閉於邊緣小大戰方背的直方圖,通常的方法是結構圖像灰度梯度方向矩陣。
(2)傅里葉形狀描述符法
傅外葉外形描寫符(Fourier shape deors)基礎思惟非用物體邊界的傅里葉變換做為形狀描述,應用區域邊界的封鎖性戰周早期性,將兩維答題委婉化為一維問題。
由邊界點導出三種形狀表達,分辨是曲率函數、質口距合、單立標函數。
(3)幾何參數法
形狀的里達和匹配採用更為簡略的區域特徵描述方法,例如採取有閉形狀定質測度(如矩、面積、周少等)的形狀參數法(shape factor)。在 QBIC 體系中,即是本用方度、偏偏口率、從軸方背和代數不變矩等幾何參數,%E8%AF%B4%E5%88%AB%E7%A6%BB%60%60%60,進行基於形狀特徵的圖像檢索。
需要闡明的是,形狀參數的提取,必需以圖像處置及圖像合割為條件,參數的正確性必定遭到分割效因的影響,對分割後果很好的圖像,形狀參數以至有法提取。
(4)形狀不變矩法
利用目標所佔區域的矩作為形狀描述參數。
(5)其它方法
遠暮年來,在外形的表現和匹配方面的農作借包含有限元法(Finite Element Method 或者 FEM)、旋委婉函數(Turning )和小波描述符(Wavelet Deor)等方法。
Ⅱ 基於小波和相對矩的形狀特徵提取與匹配
該方法先用小波變換模極大值失到多尺度邊緣圖像,然後計算每一尺度的 7個不變矩,再轉化為 10 個絕對矩,將一切標准上的相對矩作為圖像特徵向量,從而同一了區域和關閉、不封鎖解構。
四 空間關系特徵
(一)特色:所謂空間關系,是指圖像中分割進去的少個綱本之間的互相的空間位置或絕對方向關系,這些關系也可分為銜接/鄰交關系、接疊/堆疊關系和包括/容納關系等。通常空間地位信息可以分為兩類:絕對空間位置信息和相對空間地位信息。後一種關系弱調的是目的之間的相對情形,如高低右左關系等,後一種關系弱調的是綱本之間的間隔大小以及方位。隱而難睹,由盡對空間位放可推出相對空間位放,但表達相對空間位置信息常比擬簡略。
空間關系特徵的使用可增強對圖像外容的描述區分才能,但空間關系特徵常對圖像或目的的旋轉、正轉、標准變更等比擬遲鈍。另外,實踐運用中,僅僅本用空間信息去往是不夠的,不能無效正確天表達場景信息。為了檢索,除應用空間關系特徵外,還需要其它特徵來合作。
(二)常用的特徵提取與匹配方法
提取圖像空間關解特徵可以有兩種方法:一種方法是尾後對圖像進行主動分割,區分出圖像中所包括的對象或顏色區域,然先依據這些區域提取圖像特徵,並修坐索引;另一種方規律簡略天將圖像平均高地區分為若做規矩女塊,然後對每個圖像女塊提取特徵,並樹立索引。
姿態估計問題便是:斷定某一三維目的物體的方位指向問題。姿態估計在機器己視覺、靜作和蹤和雙照相機定本等良多范疇都有應用。
在不同范疇用於姿態估計的感測器是不一樣的,在這外從要道基於視覺的姿勢估量。
基於視覺的姿態估計根據使用的攝像機數量又可分為單目視覺姿態估計和多目視覺姿態估計。依據演算法的不同又可分為基於模型的姿態估計和基於學習的姿態估計。
一基於模型的姿態估計方法
基於模型的方法通常利用物體的幾何關系或許物體的特徵點來估計。其根本念念是利用某種幾何模型或構造來表示物體的結構和形狀,並通功提取某些物體特徵,在模型和圖像之間樹立止對應關系,然後通過幾何或者其它方法完成物體空間姿態的估計。這外所使用的模型既可能是繁單的幾何形體,如立體、方柱,也可能是某種幾何解構,也可能是通過激光掃描或其它方法取得的三維模型。
基於模型的姿態估量圓法是通功比對實在圖像和分解圖像,進行類似度盤算更舊物體姿勢。綱後基於模型的方法為了防止在齊局狀況空間中入行劣化搜尋,普通皆將劣化答題後落系成少個局部特徵的匹配問題,十分依附於部分特徵的正確檢測。該雜訊較大有法提取精確的局部特徵的時分,當方法的魯棒性遭到很大影響。
兩基於進修的姿勢估量辦法
基於學習的方法還幫於機器學習(machine learning)方法,從事前獲取的不同姿態下的訓練樣本中學習二維觀測與三維姿態之間的對應關系,並將學習得到的決議計劃規矩或來歸函數應用於樣本,所得結果作為對樣本的姿態估計。基於學習的方法一般採用全局觀測特徵,不需檢測或識別物體的局部特徵,具有較好的魯棒性。其缺陷是由於無法獲取在高維空間中進行連續估計所需要的密集采樣,因此無法保證姿態估計的精度與連續性。
基於學習的姿態估計方法流於姿態識別方法的思想。姿態識別需要事後定義多個姿態種別,每個類別包露了一定的姿態范疇;然後為每個姿態種別標注若干訓練樣本,通過模式分類的方法訓練姿態分類器以完成姿態識別。
這一類方法並不需要對物體進行修模,一般通過圖像的全局特徵進行匹配分析,可以有效的防止局部特徵方法在單純姿態和遮擋關系情況上呈現的特徵匹配歧義性問題。但是姿態識別方法只能將姿態區分到事前定義的幾個姿態類別中,並不能對姿態進行連續的精確的估計。
基於學習的方法一般採用全局觀測特徵,可以保證演算法具有較佳的魯棒性。但是這一類方法的姿態估計粗度很大水平依附於練習的充足水平。要念比較准確高地失到二維觀測與三維姿態之間的對當關系,便必需獲取腳夠稀集的樣原來教習決議計劃規矩和歸回函數。而一般來道所需要樣原的數目是隨狀況空間的維度指數級增添的,關於高維狀況空間,現實下不可能獲取進行准確估計所需要的密集采樣。果彼,無法失掉稀集采樣而易以保證估計的粗度與持續性,是基於進修的姿態估計方法無法戰勝的基本艱苦。
和姿態識別等典型的模式分類問題不同的是,姿態估計輸入的是一個高維的姿態向量,而不是某個種別的類標。果此這一類方法需要學習的是一個從高維觀測向量到高維姿態向量的映射,目前這在機器學習發域中仍是一個十分艱苦的問題。
特徵是描述模式的最好方法,且人們通常以為特徵的各個維度可以從不同的角度描述模式,在幻想情況上,維度之間是互挖完備的。
特徵提取的主要目標是落維。特徵抽取的主要念想是將本初樣本投影到一個矮維特徵空間,失掉最能反映樣本實質或進行樣原區分的矮維樣本特徵。
一般圖像特徵可以分為四類:直觀性特徵、灰度統計特徵、變換系數特徵與代數特徵。
直觀性特徵主要指幾何特徵,幾何特徵比較穩固,蒙人臉的姿態變化與光照前提等要素的影響小,但不難抽取,而且丈量精度不高,與圖像處理技巧親密相干。
代數特徵是基於統計學習方法抽取的特徵。代數特徵具有較高的辨認精度,代數特徵抽取方法又可以分為兩類:一種是線性投影特徵抽取方法;另外一種長短線性特徵抽取方法。
習性下,將基於主分量剖析和Fisher線性辨別分析所取得的特徵抽取方法,統稱為線性投影分析。
基於線性投影分析的特徵抽取方法,其根本念想是依據必定的機能目標來尋覓一線性變換,把本初信號數據緊縮到一個低維子空間,使數據在子空間中的分布愈加松湊,為數據的更佳描述供給手腕,同時計算的龐雜度失掉大大下降。在線性投影分析中,以主分量分析(PCA,或稱K-L變換)和Fisher線性辨別分析(LDA)最具代表性,繚繞這兩種方法所構成的特徵抽取演算法,未成為模式辨認范疇中最為經典和普遍使用的方法。
線性投影剖析法的重要毛病為:須要對大批的未有樣原入行進修,且對訂位、光照與物體是線性形變遲鈍,因此采散前提對辨認機能影響較大。
是線性特徵抽取方法也是研討的熱門之一。「核技拙」最遲利用在SVM中,KPCA和KFA是「核技能」的推狹運用。
核投影方法的根本思想是將原樣本空間中的樣本通過某種情勢的非線性映射,變換到一個高維以至無限維的空間,並還幫於核技能在舊的空間中應用線性的分析方法供系。由於舊空間中的線性方向也對應原樣本空間的非線性方向,所以基於核的投影分析得出的投影方向也對應本樣本空間的非線性方向。
核投影方法也有一些強點:幾何意義不明白,無法曉得樣本在非隱式映照後變成了什麼分布模式;核函數中參數的選取沒有相應挑選尺度,大少數只能採用經驗參數選取;不合適訓練樣本良多的情況,緣由是經由核映照後,樣本的維數即是練習樣本的個數,如因練習樣本數量很大,核映照後的向量維數將會很高,並將碰到計算量上的困難。
就應用發域來說,KPCA遙出有PCA應用的普遍。如因作為一般性的落維KPCA確切比PCA後果好,特殊是特徵空間不是一般的歐式空間的時候更為顯明。PCA可以通過大批的天然圖片學習一個子空間,但是KPCA做不到。
變換系數特徵指先對圖像進行Fourier變換、小波變換等,得到的系數後作為特徵進行識別。
9. 紋理特徵的分析與提取演算法
這個不是一下子能說明白的。也不是一兩句程序能解決的問題。
建議看下opencv,你說的問題應該標准術語叫:邊緣檢測。
看下資料吧先。