導航:首頁 > 源碼編譯 > 蘭德系數源碼

蘭德系數源碼

發布時間:2022-09-28 02:08:07

⑴ 聚類的評價指標

在聚類任務中,常見的評價指標有:准確率、F值、調整蘭德系數和標准互信息素。
將物理或抽象對象的集合分成由類似的對象組成的多個類的過程被稱為聚類。由聚類所生成的簇是一組數據對象的集合,這些對象與同一個簇中的對象彼此相似,與其他簇中的對象相異。「物以類聚,人以群分」,在自然科學和社會科學中,存在著大量的分類問題。聚類分析又稱群分析,它是研究(樣品或指標)分類問題的一種統計分析方法。聚類分析起源於分類學,但是聚類不等於分類。聚類與分類的不同在於,聚類所要求劃分的類是未知的。聚類分析內容非常豐富,有系統聚類法、有序樣品聚類法、動態聚類法、模糊聚類法、圖論聚類法、聚類預報法等。

⑵ 我們一般使用哪些指標判斷聚類結果的優劣

有參考標準的指標主要有:

1、Jaccard系數(Jaccard Coefficient, JC)
2、FM指數(Fowlkes and Mallows Index, FMI)
3、Rand指數(Rand Index, RI)
4、F值(F-measure)
上述性能度量的結果值均在[0,1]區間,值越大越好,值越大表明聚類結果和參考模型,直接的聚類結果越吻合,聚類結果就相對越好。
5、蘭德系數(Rand index,RI)需要給定實際類別信息C,假設K是聚類結果,RI取值范圍為[0,1],值越大意味著聚類結果與真實情況越吻合。
6、調整蘭德系數(Adjusted rand index)對於隨機結果,RI並不能保證分數接近零。所以ARI取值范圍為[-1,1],值越大意味著聚類結果與真實情況越吻合。從廣義的角度來講,ARI衡量的是兩個數據分布的吻合程度。

無監督的,無需基準數據集,不需要藉助於外部參考模型指標有:

1、緊密度(Compactness):每個聚類簇中的樣本點到聚類中心的平均距離。對應聚類結果,需要使用所有簇的緊密度的平均值來衡量聚類演算法和聚類各參數選取的優劣。緊密度越小,表示簇內的樣本點月集中,樣本點之間聚類越短,也就是說簇內相似度越高。
2、分割度(Seperation):是個簇的簇心之間的平均距離。分割度值越大說明簇間間隔越遠,分類效果越好,即簇間相似度越低。
3、戴維森堡丁指數(Davies-bouldin Index,DBI):該指標用來衡量任意兩個簇的簇內距離之後與簇間距離之比。該指標越小表示簇內距離越小,簇內相似度越高,簇間距離越大,簇間相似度低。
4、鄧恩指數(Dunn Validity Index,DVI):任意兩個簇的樣本點的最短距離與任意簇中樣本點的最大距離之商。該值越大,聚類效果越好。
5、輪廓系數 (Silhouette Coefficient):對於一個樣本集合,它的輪廓系數是所有樣本輪廓系數的平均值。輪廓系數的取值范圍是[-1,1],同類別樣本距離越相近不同類別樣本距離越遠,分數越高。

若幫助到您,求採納~

閱讀全文

與蘭德系數源碼相關的資料

熱點內容
程序員用得到數字區嗎 瀏覽:170
python求商 瀏覽:473
ipad能用c語言編譯器嗎 瀏覽:557
軟泥解壓球最新版 瀏覽:994
4萬程序員辭職創業 瀏覽:755
thinkingphp 瀏覽:593
安卓相冊移動文件夾 瀏覽:2
耳朵清潔解壓聲控99的人都睡得著 瀏覽:201
叉車出租網站源碼 瀏覽:870
共享單車的app是什麼 瀏覽:404
不帶gui的伺服器什麼意思 瀏覽:369
金剛經及PDF 瀏覽:98
php中冒號 瀏覽:354
php5432 瀏覽:348
命令在哪使用 瀏覽:168
php獲取網頁元素 瀏覽:704
為什麼需要硬體驅動編譯 瀏覽:881
pm編程怎樣看導柱孔對不對稱 瀏覽:134
農業大學選課找不到伺服器怎麼辦 瀏覽:645
路由配置網關命令 瀏覽:931