❶ 時間序列的聚類不知道怎麼聚 求幫助!
時間序列是指將某種現象某一個統計指標在不同時間上的各個數值,按時間先後順序排列而形成的序列。
時間序列法是一種定量預測方法,亦稱簡單外延方法。在統計學中作為一種常用的預測手段被廣泛應用。
❷ 聚類演算法可以和時間序列相結合做預測嗎
你好,
如果你處理的數據本身就是時間序列數據,如果採用聚類的話,就會忽略數據的順序信息。也就是說並不知道得到那些簇之間的先後順序,既然不知道順序用時間序列來坐預測就沒有什麼意義。
你對數據先聚類後預測,我大致能了解你的意圖。你可以試著把聚類演算法換成序列模式挖掘演算法。比如,利用PrefixSpan找出頻繁出現的序列模式,那樣的話,給定一個序列模式,直接去匹配最符合的頻繁模式,就可以做簡單的預測。
此外,針對時間序列預測,有專門的比如ARIMA這種演算法來進行預測,為什麼要先聚類了?
❸ 什麼是時間序列聚類呀~~詳細點兒的
理解了時間序列與普通數據的區別就明白了。按順序排列的多個普通數據點構成了時間序列,比如一個單詞或短語的發音,在這個發音時間內,頻率隨時間按一定規律變化,幅值也按自己的規律變化;如果你通過分析很多小段的語音,發現了相似的(頻率、幅值)變化規律,就把它們聚類為同一個單詞或短語。不知這樣比喻是否恰當。
❹ 時間序列模型和神經網路模型有何區別
時間序列模型是指採用某種演算法(可以是神經網路、ARMA等)模擬歷史數據,找出其中的變化規律,
神經網路模型是一種演算法,可以用於分類、聚類、預測等等不用領域;
兩者一個是問題模型,一個是演算法模型
❺ 聚類分析中,想把曲線走勢相近的分成一類,應該怎樣做用聚類分析中的哪種方法 在線急求
首先用極差法對數據做標准化,注意,是以國家為單位做標准化,即對行做標准化,一般spss提供的標准化是對列進行標准化的。。。然後跑spss裡面的 聚類演算法就可以了。
PS:你說的數據算是時間序列序列,聚類時最好不要用歐氏距離,用曼哈頓或閔科夫斯基距離較好。
❻ 增量聚類演算法包括哪些
bigshuai
增量聚類演算法
目前有關增量聚類的研究主要是將增量數據看成是時間序列數據或按特定順序的數據, 主要可以分成兩類: 一類是每次將所有數據進行迭代,即從第一個數據到最後一個數據進行迭代運算, 其優點是精度高, 不足之處是不能利用前一次聚類的結果, 浪費資源; 另一類是利用上一次聚類的結果,每次將一個數據點劃分到已有簇中, 即新增的數據點被劃入中心離它最近的簇中並將中心移向新增的數據點, 也就是說新增的數據點不會影響原有劃分, 其優點是不需要每次對所有數據進行重新聚類, 不足之處是泛化能力弱, 監測不出孤立點。因此, 如何設計增量聚類演算法以提高聚類效率, 成為當前聚類分析的一個重要挑戰。
目前存在各種各樣的聚類方法[ 3] , 傳統的聚類方法主要被劃分成五類: 基於層次的、基於劃分的、基於密度的、基於網格的和基於模型的聚類。基於層次的聚類和基於劃分的聚類是實際生活中應用最為廣泛的兩類。前者可以進一步劃分為自底向上和自頂向下兩種[ 1] , 例如CLIQUE[ 3] 、ENCLUS 和MAFIA[ 4] 屬於自底向上演算法, PROCLUS[ 5] 和ORCLUS[ 6 ]屬於自頂向下的演算法。但是, 傳統的層次聚類演算法由於計算量過大不適用於大數據集, 例如BIRCH[ 2] 和CURE[ 7 ] 。傳統的基於劃分的演算法包括k-means、k-modes等等, 其中k-means是現存聚類演算法中最經典的聚類演算法[ 8, 9] 。
增量聚類是維持或改變k 個簇的結構的問題。比如, 一個特定序列中的新的數據點可能被劃分到已有k 個簇的一個簇中, 也可能被劃分到新的簇中,此時會需要將另外兩個簇變成一個[ 10 ] 。自從H art igan在文獻[ 11]中提出的演算法被實現[ 12] , 增量聚類就吸引了眾人的關注。D. Fisher[ 13] 提出的COBWEB 演算法是一種涉及到增量形式數據點的增量聚類演算法。文獻[ 14, 15]中給出了與資料庫的動態方面相關的增量聚類的詳細闡述, 文獻[ 16 18]中列出了其廣泛應用的領域。對增量聚類產生興趣的動力是主存空間有限, 有些信息不需要存儲起來,例如數據點之間的距離, 同時增量聚類演算法可以根據數據點集的大小和屬性數進行擴展[ 19] 。文獻[ 10, 17]中也對於求解增量聚類問題的演算法進行了研究。
現在很多聚類演算法都是對單一數據類型的數據進行聚類, 但是現實數據中非常多的數據都是混合數據類型的數據, 既包含數值屬性數據, 還是分類屬性數據, 簡單地丟棄其中一種數據類型, 或者將其中一種數據類型轉換成另一種, 都會影響聚類的精度。因此, 混合屬性數據增量聚類的研究具有非常重要的意義。
2 基於傳統聚類方法及其變形的增量聚類演算法
現在對於增量聚類方法的增量處理主要集中在三個方面, 一類是基於傳統聚類方法及其各種變形的增量聚類演算法, 一類是基於生物智能的增量聚類演算法, 另一類是針對數據流的聚類演算法。