❶ 聚類演算法有哪些
聚類方法分為以下幾類:
分割方法:K-means
分層次方法:ROCK 、 Chemeleon
基於密度的方法:DBSCAN
基於網格的方法:STING 、 WaveCluster
等等
❷ 幾種分類方法的應用效果
(1)基於ISODATA演算法的非監督分類實現與效果
ISODATA法的實質是以初始類別為「種子」施行自動迭代聚類的過程。迭代結束標志著分類所依據的基準類別已經確定,它們的分布參數也在不斷的「聚類訓練」中逐漸確定,並最終用於構建所需要的判決函數。從這個意義上講,基準類別參數的確定過程,也是對判決函數的不斷調整和「訓練」過程。
此次實現過程是在基於 IDL 語言下的 ENVI4.0 環境下實現的。主要參數如下:擬分類個數(Number of Classes):6;最大迭代次數(Maximum Iterations):8;像元變化閾值(Change Thresh-old):5%;一類中的最小像元數(Minimum Pixel in Class):5;類的最大標准差(Maximum Class Stdv):1;最小距離(Minimum Class Distance):5;合並成對類別的最大值(Maximum Merge Pairs):2;我們想要計算所有像元的DN值,故距離類別均值得標准差(Maximum Stdev From Mean)和所允許的最大距離誤差(Maximum Distance Error)均為預設DN值。
圖3-24是顯示康恩納德斑岩銅礦床周圍的影像為處理數據源的ISODATA非監督分類圖。
表3-17 康恩納德礦點ETM+遙感影像分類後類別比重表
❸ isodata聚類演算法用什麼軟體
可以的,isodata演算法是自己設定聚類個數的,我不知道你是用的什麼工具編程,還是用的某個軟體,但是裡面必然會有設置參數的地方,把聚類個數對應的參數改成三就可以了。你可以試試模糊聚類,比如模糊c均值,它聚類性能要比硬聚類演算法好一些,matlab裡面有自帶的程序。
❹ 各種遙感數據分類方法比較
常用的遙感數據的專題分類方法有多種,從分類判別決策方法的角度可以分為統計分類器、神經網路分類器、專家系統分類器等;從是否需要訓練數據方面,又可以分為監督分類器和非監督分類器。
一、統計分類方法
統計分類方法分為非監督分類方法和監督分類方法。非監督分類方法不需要通過選取已知類別的像元進行分類器訓練,而監督分類方法則需要選取一定數量的已知類別的像元對分類器進行訓練,以估計分類器中的參數。非監督分類方法不需要任何先驗知識,也不會因訓練樣本選取而引入認為誤差,但非監督分類得到的自然類別常常和研究感興趣的類別不匹配。相應地,監督分類一般需要預先定義分類類別,訓練數據的選取可能會缺少代表性,但也可能在訓練過程中發現嚴重的分類錯誤。
1.非監督分類器
非監督分類方法一般為聚類演算法。最常用的聚類非監督分類方法是 K-均值(K-Means Algorithm)聚類方法(Duda and Hart,1973)和迭代自組織數據分析演算法(ISODATA)。其演算法描述可見於一般的統計模式識別文獻中。
一般通過簡單的聚類方法得到的分類結果精度較低,因此很少單獨使用聚類方法進行遙感數據專題分類。但是,通過對遙感數據進行聚類分析,可以初步了解各類別的分布,獲取最大似然監督分類中各類別的先驗概率。聚類分析最終的類別的均值矢量和協方差矩陣可以用於最大似然分類過程(Schowengerdt,1997)。
2.監督分類器
監督分類器是遙感數據專題分類中最常用的一種分類器。和非監督分類器相比,監督分類器需要選取一定數量的訓練數據對分類器進行訓練,估計分類器中的關鍵參數,然後用訓練後的分類器將像元劃分到各類別。監督分類過程一般包括定義分類類別、選擇訓練數據、訓練分類器和最終像元分類四個步驟(Richards,1997)。每一步都對最終分類的不確定性有顯著影響。
監督分類器又分為參數分類器和非參數分類器兩種。參數分類器要求待分類數據滿足一定的概率分布,而非參數分類器對數據的概率分布沒有要求。
遙感數據分類中常用的分類器有最大似然分類器、最小距離分類器、馬氏距離分類器、K-最近鄰分類器(K-Nearest neighborhood classifier,K-NN)以及平行六面體分類器(parallelepiped classifier)。最大似然、最小距離和馬氏距離分類器在第三章已經詳細介紹。這里簡要介紹 K-NN 分類器和平行六面體分類器。
K-NN分類器是一種非參數分類器。該分類器的決策規則是:將像元劃分到在特徵空間中與其特徵矢量最近的訓練數據特徵矢量所代表的類別(Schowengerdt,1997)。當分類器中 K=1時,稱為1-NN分類器,這時以離待分類像元最近的訓練數據的類別作為該像元的類別;當 K >1 時,以待分類像元的 K 個最近的訓練數據中像元數量最多的類別作為該像元的類別,也可以計算待分類像元與其 K 個近鄰像元特徵矢量的歐氏距離的倒數作為權重,以權重值最大的訓練數據的類別作為待分類像元的類別。Hardin,(1994)對 K-NN分類器進行了深入的討論。
平行六面體分類方法是一個簡單的非參數分類演算法。該方法通過計算訓練數據各波段直方圖的上限和下限確定各類別像元亮度值的范圍。對每一類別來說,其每個波段的上下限一起就形成了一個多維的盒子(box)或平行六面體(parallelepiped)。因此 M 個類別就有M 個平行六面體。當待分類像元的亮度值落在某一類別的平行六面體內時,該像元就被劃分為該平行六面體代表的類別。平行六面體分類器可以用圖5-1中兩波段的遙感數據分類問題來表示。圖中的橢圓表示從訓練數據估計的各類別亮度值分布,矩形表示各類別的亮度值范圍。像元的亮度落在哪個類別的亮度范圍內,就被劃分為哪個類別。
圖5-1 平行六面體分類方法示意圖
3.統計分類器的評價
各種統計分類器在遙感數據分類中的表現各不相同,這既與分類演算法有關,又與數據的統計分布特徵、訓練樣本的選取等因素有關。
非監督聚類演算法對分類數據的統計特徵沒有要求,但由於非監督分類方法沒有考慮任何先驗知識,一般分類精度比較低。更多情況下,聚類分析被作為非監督分類前的一個探索性分析,用於了解分類數據中各類別的分布和統計特徵,為監督分類中類別定義、訓練數據的選取以及最終的分類過程提供先驗知識。在實際應用中,一般用監督分類方法進行遙感數據分類。
最大似然分類方法是遙感數據分類中最常用的分類方法。最大似然分類屬於參數分類方法。在有足夠多的訓練樣本、一定的類別先驗概率分布的知識,且數據接近正態分布的條件下,最大似然分類被認為是分類精度最高的分類方法。但是當訓練數據較少時,均值和協方差參數估計的偏差會嚴重影響分類精度。Swain and Davis(1978)認為,在N維光譜空間的最大似然分類中,每一類別的訓練數據樣本至少應該達到10×N個,在可能的條件下,最好能達到100×N以上。而且,在許多情況下,遙感數據的統計分布不滿足正態分布的假設,也難以確定各類別的先驗概率。
最小距離分類器可以認為是在不考慮協方差矩陣時的最大似然分類方法。當訓練樣本較少時,對均值的估計精度一般要高於對協方差矩陣的估計。因此,在有限的訓練樣本條件下,可以只估計訓練樣本的均值而不計算協方差矩陣。這樣最大似然演算法就退化為最小距離演算法。由於沒有考慮數據的協方差,類別的概率分布是對稱的,而且各類別的光譜特徵分布的方差被認為是相等的。很顯然,當有足夠訓練樣本保證協方差矩陣的精確估計時,最大似然分類結果精度要高於最小距離精度。然而,在訓練數據較少時,最小距離分類精度可能比最大似然分類精度高(Richards,1993)。而且最小距離演算法對數據概率分布特徵沒有要求。
馬氏距離分類器可以認為是在各類別的協方差矩陣相等時的最大似然分類。由於假定各類別的協方差矩陣相等,和最大似然方法相比,它丟失了各類別之間協方差矩陣的差異的信息,但和最小距離法相比較,它通過協方差矩陣保持了一定的方向靈敏性(Richards,1993)。因此,馬氏距離分類器可以認為是介於最大似然和最小距離分類器之間的一種分類器。與最大似然分類一樣,馬氏距離分類器要求數據服從正態分布。
K-NN分類器的一個主要問題是需要很大的訓練數據集以保證分類演算法收斂(Devijver and Kittler,1982)。K-NN分類器的另一個問題是,訓練樣本選取的誤差對分類結果有很大的影響(Cortijo and Blanca,1997)。同時,K-NN分類器的計算復雜性隨著最近鄰范圍的擴大而增加。但由於 K-NN分類器考慮了像元鄰域上的空間關系,和其他光譜分類器相比,分類結果中「椒鹽現象」較少。
平行六面體分類方法的優點在於簡單,運算速度快,且不依賴於任何概率分布要求。它的缺陷在於:首先,落在所有類別亮度值范圍之外的像元只能被分類為未知類別;其次,落在各類別亮度范圍重疊區域內的像元難以區分其類別(如圖5-1所示)。
各種統計分類方法的特點可以總結為表5-1。
二、神經網路分類器
神經網路用於遙感數據分類的最大優勢在於它平等地對待多源輸入數據的能力,即使這些輸入數據具有完全不同的統計分布,但是由於神經網路內部各層大量的神經元之間連接的權重是不透明的,因此用戶難以控制(Austin,Harding and Kanellopoulos et al.,1997)。
神經網路遙感數據分類被認為是遙感數據分類的熱點研究領域之一(Wilkinson,1996;Kimes,1998)。神經網路分類器也可分為監督分類器和非監督分類器兩種。由於神經網路分類器對分類數據的統計分布沒有任何要求,因此神經網路分類器屬於非參數分類器。
遙感數據分類中最常用的神經網路是多層感知器模型(multi-layer percep-tron,MLP)。該模型的網路結構如圖5-2所示。該網路包括三層:輸入層、隱層和輸出層。輸入層主要作為輸入數據和神經網路輸入界面,其本身沒有處理功能;隱層和輸出層的處理能力包含在各個結點中。輸入的結構一般為待分類數據的特徵矢量,一般情況下,為訓練像元的多光譜矢量,每個結點代表一個光譜波段。當然,輸入結點也可以為像元的空間上下文信息(如紋理)等,或多時段的光譜矢量(Paola and Schowengerdt,1995)。
表5-1 各種統計分類器比較
圖5-2 多層感知器神經網路結構
對於隱層和輸出層的結點來說,其處理過程是一個激勵函數(activation function)。假設激勵函數為f(S),對隱層結點來說,有:
遙感信息的不確定性研究
其中,pi為隱層結點的輸入;hj為隱層結點的輸出;w為聯接各層神經之間的權重。
對輸出層來說,有如下關系:
遙感信息的不確定性研究
其中,hj為輸出層的輸入;ok為輸出層的輸出。
激勵函數一般表達為:
遙感信息的不確定性研究
確定了網路結構後,就要對網路進行訓練,使網路具有根據新的輸入數據預測輸出結果的能力。最常用的是後向傳播訓練演算法(Back-Propagation)。這一演算法將訓練數據從輸入層進入網路,隨機產生各結點連接權重,按式(5-1)(5-2)和(5-3)中的公式進行計算,將網路輸出與預期的結果(訓練數據的類別)相比較並計算誤差。這個誤差被後向傳播的網路並用於調整結點間的連接權重。調整連接權重的方法一般為delta規則(Rumelhart,et al.,1986):
遙感信息的不確定性研究
其中,η為學習率(learning rate);δk為誤差變化率;α為動量參數。
將這樣的數據的前向和誤差後向傳播過程不斷迭代,直到網路誤差減小到預設的水平,網路訓練結束。這時就可以將待分類數據輸入神經網路進行分類。
除了多層感知器神經網路模型,其他結構的網路模型也被用於遙感數據分類。例如,Kohonen自組織網路被廣泛用於遙感數據的非監督聚類分析(Yoshida et al.,1994;Schaale et al.,1995);自適應共振理論(Adaptive Resonance Theory)網路(Silva,S and Caetano,M.1997)、模糊ART圖(Fuzzy ART Maps)(Fischer,M.M and Gopal,S,1997)、徑向基函數(駱劍承,1999)等也被用於遙感數據分類。
許多因素影響神經網路的遙感數據分類精度。Foody and Arora(1997)認為神經網路結構、遙感數據的維數以及訓練數據的大小是影響神經網路分類的重要因素。
神經網路結構,特別是網路的層數和各層神經元的數量是神經網路設計最關鍵的問題。網路結構不但影響分類精度,而且對網路訓練時間有直接影響(Kavzoglu and Mather,1999)。對用於遙感數據分類的神經網路來說,由於輸入層和輸出層的神經元數目分別由遙感數據的特徵維數和總的類別數決定的,因此網路結構的設計主要解決隱層的數目和隱層的神經元數目。一般過於復雜的網路結構在刻畫訓練數據方面較好,但分類精度較低,即「過度擬合」現象(over-fit)。而過於簡單的網路結構由於不能很好的學習訓練數據中的模式,因此分類精度低。
網路結構一般是通過實驗的方法來確定。Hirose等(1991)提出了一種方法。該方法從一個小的網路結構開始訓練,每次網路訓練陷入局部最優時,增加一個隱層神經元,然後再訓練,如此反復,直到網路訓練收斂。這種方法可能導致網路結構過於復雜。一種解決辦法是每當認為網路收斂時,減去最近一次加入的神經元,直到網路不再收斂,那麼最後一次收斂的網路被認為是最優結構。這種方法的缺點是非常耗時。「剪枝法」(pruning)是另一種確定神經網路結構的方法。和Hirose等(1991)的方法不同,「剪枝法」從一個很大的網路結構開始,然後逐步去掉認為多餘的神經元(Sietsma and Dow,1988)。從一個大的網路開始的優點是,網路學習速度快,對初始條件和學習參數不敏感。「剪枝」過程不斷重復,直到網路不再收斂時,最後一次收斂的網路被認為最優(Castellano,Fanelli and Pelillo,1997)。
神經網路訓練需要訓練數據樣本的多少隨不同的網路結構、類別的多少等因素變化。但是,基本要求是訓練數據能夠充分描述代表性的類別。Foody等(1995)認為訓練數據的大小對遙感分類精度有顯著影響,但和統計分類器相比,神經網路的訓練數據可以比較少。
分類變數的數據維對分類精度的影響是遙感數據分類中的普遍問題。許多研究表明,一般類別之間的可分性和最終的分類精度會隨著數據維數的增大而增高,達到某一點後,分類精度會隨數據維的繼續增大而降低(Shahshahani and Landgrebe,1994)。這就是有名的Hughes 現象。一般需要通過特徵選擇去掉信息相關性高的波段或通過主成分分析方法去掉冗餘信息。分類數據的維數對神經網路分類的精度同樣有明顯影響(Battiti,1994),但Hughes 現象沒有傳統統計分類器中嚴重(Foody and Arora,1997)。
Kanellopoulos(1997)通過長期的實踐認為一個有效的ANN模型應考慮以下幾點:合適的神經網路結構、優化學習演算法、輸入數據的預處理、避免振盪、採用混合分類方法。其中混合模型包括多種ANN模型的混合、ANN與傳統分類器的混合、ANN與知識處理器的混合等。
三、其他分類器
除了上述統計分類器和神經網路分類器,還有多種分類器被用於遙感圖像分類。例如模糊分類器,它是針對地面類別變化連續而沒有明顯邊界情況下的一種分類器。它通過模糊推理機制確定像元屬於每一個類別的模糊隸屬度。一般的模糊分類器有模糊C均值聚類法、監督模糊分類方法(Wang,1990)、混合像元模型(Foody and Cox,1994;Settle and Drake,1993)以及各種人工神經網路方法等(Kanellopoulos et al.,1992;Paola and Schowengerdt,1995)。由於模糊分類的結果是像元屬於每個類別的模糊隸屬度,因此也稱其為「軟分類器」,而將傳統的分類方法稱為「硬分類器」。
另一類是上下文分類器(contextual classifier),它是一種綜合考慮圖像光譜和空間特徵的分類器。一般的光譜分類器只是考慮像元的光譜特徵。但是,在遙感圖像中,相鄰的像元之間一般具有空間自相關性。空間自相關程度強的像元一般更可能屬於同一個類別。同時考慮像元的光譜特徵和空間特徵可以提高圖像分類精度,並可以減少分類結果中的「椒鹽現象」。當類別之間的光譜空間具有重疊時,這種現象會更明顯(Cortijo et al.,1995)。這種「椒鹽現象」可以通過分類的後處理濾波消除,也可以通過在分類過程中加入代表像元鄰域關系的信息解決。
在分類過程中可以通過不同方式加入上下文信息。一是在分類特徵中加入圖像紋理信息;另一種是圖像分割技術,包括區域增長/合並常用演算法(Ketting and Landgrebe,1976)、邊緣檢測方法、馬爾可夫隨機場方法。Rignot and Chellappa(1992)用馬爾可夫隨機場方法進行SAR圖像分類,取得了很好的效果,Paul Smits(1997)提出了保持邊緣細節的馬爾可夫隨機場方法,並用於SAR圖像的分類;Crawford(1998)將層次分類方法和馬爾可夫隨機場方法結合進行SAR圖像分類,得到了更高的精度;Cortijo(1997)用非參數光譜分類對遙感圖像分類,然後用ICM演算法對初始分類進行上下文校正。
❺ 利用ERDAS對tm遙感影像分類步驟 要詳細的 急急急
山東科技大學測繪學院遙感系
非監督分類
一、實習目的:掌握非監督分類的方法與過程,加深對非監督分類方法的理解
二 非監督分類(Unsupervised Classification)
ERDAS IMAGINE使用ISODATA演算法(基於最小光譜距離公式)來進行非監督分類。聚類過程始於任意聚類平均值或一個己有分類模板的平均值:聚類每重復一次,聚類的平均值就更新一次,新聚類的均值再用於下次聚類循環。 ISODATA實用程序不斷重復,直到最大的循環次數已達到設定閾值或者兩次聚類結果相比有達到要求百分比的像元類別已經不再發生變化。
第一步:啟動非監督分類
調出非監督分類對話框的方法有兩種:
→在ERDAS圖標面板工具條中單擊DataPrep圖標,打開Data Preparation對話框,在對話框中單擊Unsupervised Classfication按鈕,打開Unsupervised Classification.
→在ERDAS圖標面板工具條中單擊Classifier圖標,打開Classification對話框,單擊Unsupervised Classification按鈕,打開Unsupervised Classification對話框
第二步:進行非監督分類
在Unsupervised Classification對話框進行下列設置:
→確定輸入文件(Input Raster File)為germtm.img(被分類的圖像)。
→確定輸出文件(Output File)為germtm_isodata.img(產生的分類圖像).
→選擇生成分類模板文件為Output Signature Set (產生一個模板文件)。
→確定分類模板文件(File Name)為(germtm_isodata.sig)
→確定聚類參數(Clustering Options),需要確定初始聚類方法與分類數。
系統提供的初始聚類方法有兩種:
Initialize from Statistics方法是按照圖像的統計值產生自由聚類。
Use Signature Means方法是按照選定的模板文件進行非監督分類
確定初始分類數(Number of classes)為10(分出10個類別,實際工作中一般將初始分類數取為最終分類數的兩倍以上)。
→單擊Initializing Options按鈕。
→打開File Statistics Options對話框,設置ISODATA的一些統計參數
→單擊Color Scheme Option按鈕
→打開Output Color Scheme Options對話框,設置分類圖像彩色屬性
→確定處理參數(Processing Options),需要確定循環次數與循環閾值
→定義最大循環次數(Maximum Iterations)為24(是指ISODATA重新聚類的最多次數,是為了避免程序運行時間太長或由於沒有達到聚類標准而導致的死循環,在應用中一般將循環次數設置為6次以上)
→設置循環收斂閾值(Convergence Threshold)為0.95(是指兩次分類結果相比保持不變的象元所佔最大百分比,是為了避免ISODATA無限循環下去)。
→單擊OK按鈕(關閉Unsupervised Classification對話框,執行非監督分類)。
三:分類方法調整
第一步:顯示原圖像與分類圖像
在視窗中同時顯示germtm.img和germtm_isodat.img:兩
個圖像的疊加順序為germtm.img在下,germtm_isodat.img在上,germtm.img顯示方式用
紅(4)、綠(5)、藍(3),保證兩幅圖像疊加顯示 。
第二步:打開分類圖像屬性並調整欄位顯示順序
在視窗工具條中:點擊圖標(或者選擇Raster菜單項—--選擇Tools菜單)
打開Raster工具面板
→點擊Raster工具面板的圖標(或者在視窗菜單條:Rster---Attributes)
→打開Raster Attribute Editor對話框
屬性表中的11個記錄分別對應產生的10個類及Unclassified類,每個記錄都有一系列的欄位。如果想看到所有欄位,需要用滑鼠拖動瀏覽條,為了方便看到關心的重要欄位,需要調整欄位顯示順序。
→ Raster Attribute Editor對話框菜單條:Edit→Column Properties →column properties對話框
→在Column Properties對話框中調整欄位順序,最後使Histogram、opacity、 color、 class_names四個手段的顯示順序依次排在前面。
→點擊OK按鈕(關閉Column properties對話框)
→返回Raster Attribute Editor對話框(lz-isodat.img的屬性表)
第三步:定義類別顏色
初始分類圖像是灰度圖像,各類別的顯示灰度是系統自動賦予的,為了提高分類圖像的直觀表達效果,需要重新定義類別顏色。
→ 在Raster Attribute Editor窗口(germtm_isodata的屬性表):
→單擊一個類別的Row欄位從而選擇該類別。
→右擊該類別的Color欄位(顏色顯示區)
→在As Is色表菜單選擇一種合適顏色
→重復以上操作,直到給所有類別賦予合適的顏色。
第四步:設置不透明度
→點擊一個類別的ROW欄位從而選擇該類別
→點擊該類別的Opacity欄位從而進入輸入狀態
→在該類別的Opacity 欄位中輸入1,並按回車鍵
此時,在視窗中只有要分析類別的顏色顯示在原圖像的上面,其它類別都是透明的。
第五步:確定類別專題意義及其准確程度
視窗菜單條:Utility→flicker→viewer Flicker對話框→Auto Mode
本小步是設置分類圖像在原圖像修背景上閃爍,觀察它與背景圖像之間的關系從而斷定該類別的專題意義,並分析其分類准確與否。
第六步:標注類別的名稱和相應顏色
Raster Attribute Editor對話框
→點擊剛才分析類別的ROW欄位從而選擇該類別
→點擊該類別的class Names欄位從而進入輸入狀態
→在該類別的Class Names欄位中輸入其專題意義(如居民區),並按回車鍵
→右鍵點擊該類別的Color欄位(顏色顯示區)
→As Is菜單→選擇一種合適的顏色
重復以上4、5、6三步直到對所有類別都進行了分析與處理。注意,在進行分類疊加分析時,一次可以選擇一個類別,也可以選擇多個類別同時進行。
第七步:類別合並與屬性重定義
如果上述各步驟操作的過程中發現分類方案不夠理想,需要進行分類後處理,諸如進行聚類分析、過濾分析、去處分析和分類重編碼等特別是有由於給定的初始分類的數量比較多,往往需要進行類別的合並操作。
具體操作步驟:
第一步 打開重編碼對話框—單擊interpreter →GIS analysis →recode
在recode對話框中設置一下參數
(1)確定輸入文件為germtm_isodata.img
(2)輸出文件為germtm_recode.img
(3)設置新的分類編碼(setup recode)
(4)根據需要改變的欄位取值
(5)單擊ok
在窗口中打開重編碼後的分類專題圖像,查看分類屬性表。
❻ 請問ISODATA演算法為什麼有一步轉向條件為「J為偶數」
因為此時分裂或者合並都可以,用偶數次時合並,奇數次時分裂,可以使得兩種操作機會均等。
❼ isodata演算法和k均值演算法的區別
k均值聚類:---------一種硬聚類演算法,隸屬度只有兩個取值0或1,提出的基本根據是「類內誤差平方和最小化」准則; 模糊的c均值聚類演算法:-------- 一種模糊聚類演算法,是k均值聚類演算法的推廣形式,隸屬度取值為[0 1]區間內的任何一個數,提出的基本...
❽ 實驗十八 遙感圖像非監督分類處理
一、實驗目的
通過使用ENVI的兩種遙感非監督分類器——IsoData非監督分類和K-Means非監督分類命令,加深對遙感非監督分類原理和對地質應用的理解,了解其技術實現過程,初步掌握其ENVI功能命令的基本使用操作。
二、實驗內容
①桂林市TM 遙感影像數據IsoData非監督分類;②桂林市TM 遙感影像數據KMeans非監督分類;③IsoData非監督分類與K-Means非監督分類效果比較分析。
三、實驗要求
(①預習ISODATA和K-Means兩種演算法原理;②掌握ISODATA和K-Means分類處理的基本操作;③對兩種分類結果進行比較分析;④編寫實驗報告。
四、技術條件
①微型計算機;②桂林市TM 遙感影像數據;③ENVI軟體;④Photoshop軟體(ver.6.0以上)和ACDSee軟體(ver.4.0以上)。
五、實驗步驟
非監督分類是根據圖像數據的本身統計特徵及點群的情況,從純統計學的角度對圖像數據進行類別劃分。非監督分類不需要事先給定類別,由圖像數據的統計特徵來決定,即同類地物在相同的成像條件下具有相同或相近的光譜特徵(如DN 值),歸屬於同一個光譜空間區域;不同地物由於光譜信息特徵不同,歸屬於不同的光譜空間區域。
非監督分類一般可分為四個步驟:執行非監督分類、類別定義、合並子類和評價結果。
(一)執行非監督分類
ENVI有ISODATA和K-Means兩種非監督分類方法。
1.ISODATA非監督分類
ISODATA(iterative self-organizing data analysis technique)屬於聚類分析方法。是按照像元之間的聯系程度(親疏程度)來進行歸類的一種多元統計分析方法。ISODATA非監督分類計算數據空間中均勻分布的類均值,然後用最小距離技術將剩餘像元迭代聚集,每次迭代都重新計算均值,且根據所得的新均值,對像元進行再分類。具體操作步驟如下:
在ENVI主菜單欄中選擇「Classification>Unsupervised>ISODATA」,在「Classificatoin Input File」對話框中選擇待分類遙感影像,打開「ISODATA Parameters」對話框,如圖18-1所示。
圖18-1 ISODATA參數對話框
對圖18-1中的參數進行如下說明:
(1) Number of Classes:類數范圍(最小值和最大值),一般輸入最小數量不能小於最終分類數量,最大數量為最終分類數量的2~3倍。
(2) Maximum Iterations:最大迭代次數值,迭代次數越大,得到的結果越精確。
(3) Change Threshold%(0~100):變化閾值(0~100%),當每一類的變換像元數小於閾值時,結束迭代過程,該值越小得到的結果越精確。
(4) Minimum #Pixel in Class:形成一類需要的最少像元數,如果某一類中的像元數少於最少像元數,該類將被刪除,其中的像元被歸並到距離最近的類中。
(5) Maximum Class Stdv:最大分類標准差,以像素值為單位,如果某一類的標准差比該閾值大,該類將被拆分成兩類。
(6) Minimum Class Distance:類均值之間的最小距離,如果類均值之間的距離小於輸入的最小值,則這一類就會被合並。
(7) Maximum #Merge Pairs:合並成對的最大數。
(8)Maximum Stdev From Mean:距離類別均值的最大標准差,為可選項,篩選小於這個標准差的像元參與分類。
(9) Maximum Distance Error:允許的最大距離誤差,為可選項,篩選小於這個最大距離誤差的像元參與分類。
(10)選擇輸出路徑及文件名,單擊【OK】按鈕,執行ISODATA非監督分類。
2.K-Means非監督分類
K-Means演算法接受輸入量K;然後將n個數據對象劃分為K個聚類以便使所獲得的聚類滿足:同一聚類中的對象相似度較高;而不同聚類中的對象相似度較小。聚類相似度是利用各聚類中對象的均值所獲得一個「中心對象」(引力中心)來進行計算的。具體操作步驟如下:
在ENVI主菜單欄中選擇「Classification>Unsupervised>K-Means」,在「Classification Input File」對話框中選擇待分類遙感影像,打開「K-Means Parameters」對話框,如圖18-2所示。
圖18-2 K-Means分類器參數設置對話框
(1) Number of Classes:分類數量,一般輸入為最終分類數量的2~3倍。
(2) Maximum Iterations:最大迭代次數值,迭代次數越大,得到的結果越精確。
(3) Maximum Stdev From Mean:距離類別均值的最大標准差,為可選項,篩選小於這個標准差的像元參與分類。
(4) Maximum Distance Error:允許的最大距離誤差,為可選項,篩選小於這個最大距離誤差的像元參與分類。
(5)選擇輸出路徑及文件名,單擊【OK】按鈕,執行K-Means非監督分類。
(二)定義類別與子類合並
執行非監督分類後,得到的只是一個初步的分類結果,需要進行類別定義域合並子類的操作。
1.類別定義
類別定義的根據可以通過更高解析度圖像上目視解譯獲得,也可以通過野外實地調查獲得。
(1)打開分類圖像即灌陽地區QuickBird遙感數據,並使之顯示在「Display」中。
(2)在分類圖像的主窗口中,選擇「Overlay>Classification」,在「Interactive Class Tool Input File」對話框中選擇非監督分類結果,單擊【OK】按鈕打開「Interactive Class Tool」對話框,如圖18-3所示。
圖18-3 互動式分類工具對話框
(3)在「Interactive Class Tool」對話框中,勾選類別前面的「On」選擇框,就能將此類結果疊加顯示在「Display」分類圖像窗口上,識別此分類類別。
(4)在「Interactive Class Tool」對話框中,選擇「Options>Edit Class Colors/Names」,打開「Class Color Map Editing」對話框,如圖18-4所示。
在「Class Color Map Editnig」對話框中,選擇對應的類別,在「Class Name」中輸入重新定義的類別名稱,同時可以修改此類別顯示的顏色,修改後點擊【OK】按鈕完成修改。
(5)重復步驟(3)~步驟(4),定義其他類別。
(6)完成各類別定義後,在「Interactive Class Tool」對話框中,選擇「File>Save Change to File」,保存修改結果。
2.合並子類
在選擇非監督分類類別數量時,一般選擇為最終分類數量的2~3倍,因此在定義類別之後,需要將相同類別合並。
(1)在 ENVI 主菜單欄中,選擇「Classification > Post Classification > Combine Classes」,在「Combine Classes Input File」對話框中選擇定義好的分類結果,單擊【OK】按鈕打開「Combine Classes Parameters」對話框(圖18-5)。
圖18-4 編輯分類名稱和顏色對話框
圖18-5 分類類別的合並對話框
(2)在「Combine Classes Parameters」對話框中,從「Select Input Class」中選擇合並的類別,從「Select Output Class」中選擇並入的類別,單擊【Add Combination】按鈕添加到合並方案中,合並方案顯示在「Combine Classes」列表中。
(3)合並方案確定後,點擊【OK】按鈕,打開「Combine Classes output」對話框,在「Remove Empty Classes」選項中選擇「Yes」,將無用類移除。
(4)選擇輸出合並結果路徑及文件夾名,點擊【OK】按鈕,執行合並子類。
(三)分類後處理和評價分類結果
分類後處理和評價分類結果的方法同監督分類一樣,可參考實驗十七中的「遙感影像監督分類」。
完成遙感影像非監督分類後,分別利用ISODATA 和K-Means非監督分類方法對灌陽地區QuickBird遙感影像進行非監督分類處理,利用混淆矩陣對兩種分類結果進行評價,得出總體分類精度和Kappa系數。比較兩種分類結果,用W ORD文件記錄,取名為《灌陽地區QuickBird遙感影像兩種非監督分類方法分類結果評價》,存入自己的工作文件夾。
六、實驗報告
(1)簡述實驗過程。
(2)回答問題:①根據實驗操作步驟及各步驟之間的關系,分析兩種非監督分類方法具有的共同特點。②通過目視解譯定性比較兩種非監督分類方法的效果。
實驗報告格式見附錄一。
❾ 什麼是ISODATA
ISODATA 是一種遙感圖像非監督分類法。全稱『迭代自組織數據分析技術』(Iterative Self-Organizing Data Analysis Technique )。 ISODATA使用最小光譜距離方程產生聚類,此方法以隨機的類中心或已知信號集中心The ISODATA 的實質是用某種演算法生成初始類別作為「種子」依據某個判別規則進行自動迭代聚類的過程。在兩次迭代的之間對上一次迭代的聚類結果進行統計分析,根據統計參數對已有類別進行取消、分裂、合並處理,並繼續進行下一次迭代,直至超過最大迭代次數或者滿足分類參數(閾值),完成分類過程。