數據挖掘k中心點演算法_kmeans聚類演算法是什麼

1. 簡述K-means演算法的基本過程及其不足。《數據挖掘》作業題追分100

過程：
1、從 n個數據對象任意選擇 k 個對象作為初始聚類中心；
2、根據每個聚類對象的均值（中心對象），計算每個對象與這些中心對象的距離；並根據最小距離重新對相應對象進行劃分；
3、重新計算每個（有變化）聚類的均值（中心對象）
4、循環步驟2和3，直到每個聚類不再發生變化為止

缺點：
1、聚類個數K需要自己決定，因此在不知道具體有多少類時需要從2開始多次嘗試，選擇最好的
2、當k確定時，聚類效果和初始中心選擇有關，所以演算法很不穩定
3、演算法在維數較多時，由於需要多次迭代，花費時間較長

2. kmeans聚類演算法是什麼

K-means演算法是最為經典的基於劃分的聚類方法，是十大經典數據挖掘演算法之一。K-means演算法的基本思想是：以空間中k個點為中心進行聚類，對最靠近他們的對象歸類。通過迭代的方法，逐次更新各聚類中心的值，直至得到最好的聚類結果。

聚類屬於無監督學習，以往的回歸、樸素貝葉斯、SVM等都是有類別標簽y的，也就是說樣例中已經給出了樣例的分類。而聚類的樣本中卻沒有給定y，只有特徵x，比如假設宇宙中的星星可以表示成三維空間中的點集。

(2)數據挖掘k中心點演算法擴展閱讀：

k個聚類以便使得所獲得的聚類滿足：同一聚類中的對象相似度較高；而不同聚類中的對象相似度較小。聚類相似度是利用各聚類中對象的均值所獲得一個「中心對象」（引力中心）來進行計算的。

（1）適當選擇c個類的初始中心；

（2）在第k次迭代中，對任意一個樣本，求其到c個中心的距離，將該樣本歸到距離最短的中心所在的類；

（3）利用均值等方法更新該類的中心值；

（4）對於所有的c個聚類中心，如果利用（2）（3）的迭代法更新後，值保持不變，則迭代結束，否則繼續迭代。

熱點內容

離心式壓縮機最小轉速發布：2025-09-10 08:00:43 瀏覽：957

什麼叫程序員加班賣命發布：2025-09-10 07:40:52 瀏覽：273

共享文件夾加密碼怎麼加發布：2025-09-10 07:37:58 瀏覽：23

一個程序員可以加班嗎發布：2025-09-10 07:30:34 瀏覽：134

鄰近梯度演算法發布：2025-09-10 07:28:28 瀏覽：572

linux運維創建文件夾發布：2025-09-10 07:20:23 瀏覽：896

win7下載java 發布：2025-09-10 07:15:24 瀏覽：280

艾葉pdf 發布：2025-09-10 07:10:03 瀏覽：440

壓縮彈簧的安裝發布：2025-09-10 06:45:32 瀏覽：307

房貸還完後到銀行解壓要多久辦完發布：2025-09-10 06:30:31 瀏覽：734

程序員錢前途發布：2025-09-10 06:30:30 瀏覽：521

雲伺服器維護用戶需要做什麼發布：2025-09-10 06:06:25 瀏覽：741

郵箱為什麼顯示伺服器配置錯誤發布：2025-09-10 05:58:35 瀏覽：469

中國趣的命令發布：2025-09-10 05:52:32 瀏覽：897

php中sleep函數發布：2025-09-10 05:39:20 瀏覽：657

程序員那麼可愛免費卡發布：2025-09-10 05:36:59 瀏覽：736

javatcp多線程發布：2025-09-10 05:29:51 瀏覽：45

深圳解壓去哪裡發布：2025-09-10 05:29:20 瀏覽：700

ash源碼解讀發布：2025-09-10 05:26:44 瀏覽：957

單片機喂狗嗎發布：2025-09-10 05:25:34 瀏覽：244

導航:首頁 > 源碼編譯 > 數據挖掘k中心點演算法

數據挖掘k中心點演算法

與數據挖掘k中心點演算法相關的資料