『壹』 時間序列分析的具體演算法
用隨機過程理論和數理統計學方法,研究隨機數據序列所遵從的統計規律,以用於解決實際問題。由於在多數問題中,隨機數據是依時間先後排成序列的,故稱為時間序列。它包括一般統計分析(如自相關分析、譜分析等),統計模型的建立與推斷,以及關於隨機序列的最優預測、控制和濾波等內容。經典的統計分析都假定數據序列具有獨立性,而時間序列分析則著重研究數據序列的相互依賴關系。後者實際上是對離散指標的隨機過程的統計分析,所以又可看作是隨機過程統計的一個組成部分。例如,用x(t)表示某地區第t個月的降雨量,{x(t),t=1,2,…}是一時間序列。對t=1,2,…,T,記錄到逐月的降雨量數據x(1),x(2),…,x(T),稱為長度為T的樣本序列。依此即可使用時間序列分析方法,對未來各月的雨量x(T+l)(l=1,2,…)進行預報。時間序列分析在第二次世界大戰前就已應用於經濟預測。二次大戰中和戰後,在軍事科學、空間科學和工業自動化等部門的應用更加廣泛。
就數學方法而言,平穩隨機序列(見平穩過程)的統計分析,在理論上的發展比較成熟,從而構成時間序列分析的基礎。
頻域分析 一個時間序列可看成各種周期擾動的疊加,頻域分析就是確定各周期的振動能量的分配,這種分配稱為「譜」,或「功率譜」。因此頻域分析又稱譜分析。譜分析中的一個重要是統計量,稱為序列的周期圖。當序列含有確定性的周期分量時,通過I(ω)的極大值點尋找這些分量的周期,是譜分析的重要內容之一。在按月記錄的降雨量序列中,序列x(t)就可視為含有以12為周期的確定分量,所以序列x(t)可以表示為 ,它的周期圖I(ω)處有明顯的極大值。
當平穩序列的譜分布函數F(λ)具有譜密度ƒ(λ)(即功率譜)時,可用(2π)-1I(λ)去估計ƒ(λ),它是ƒ(λ)的漸近無偏估計。如欲求ƒ(λ)的相合估計(見點估計),可用I(ω)的適當的平滑值去估計ƒ(λ),常用的方法為譜窗估計即取ƒ(λ)的估計弮(λ)為 ,式中wt(ω)稱為譜窗函數。譜窗估計是實際應用中的重要方法之一。譜分布F(λ)本身的一種相合估計可由I(ω)的積分直接獲得,即 。研究以上各種估計量的統計性質,改進估計方法,是譜分析的重要內容。時域分析 它的目的在於確定序列在不同時刻取值的相互依賴關系,或者說,確定序列的相關結構。這種結構是用序列的自相關函0,1,…)來描述的,為序列的自協方差函數值,m=Ex(t)是平穩序列的均值。常常採用下列諸式給出m,γ(k),ρ(k)的估計: ,通(k)了解序列的相關結構,稱為自相關分析。研究它們的強、弱相合性及其漸近分布等問題,是相關分析中的基本問題。模型分析 20世紀70年代以來,應用最廣泛的時間序列模型是平穩自回歸-滑動平均模型 (簡稱ARMA模型)。其形狀為: 式中ε(t)是均值為零、方差為σ2的獨立同分布的隨機序列;和σ2為模型的參數,它們滿足: 對一切|z|≤1的復數z成立。p和q是模型的階數,為非負整數。特別當q=0時,上述模型稱為自回歸模型;當p=0時, 稱為滑動平均模型。根據x(t)的樣本值估計這些參數和階數,就是對這種模型的統計分析的內容。對於滿足ARMA模型的平穩序列,其線性最優預測與控制等問題都有較簡捷的解決方法,尤其是自回歸模型,使用更為方便。G.U.尤爾在1925~1930年間就提出了平穩自回歸的概念。1943年,Η.Β.曼和Α.瓦爾德發表了關於這種模型的統計方法及其漸近性質的一些理論結果。一般ARMA模型的統計分析研究,則是20世紀60年代後才發展起來的。特別是關於p,q值的估計及其漸近理論,出現得更晚些。除ARMA模型之外,還有其他的模型分析的研究,其中以線性模型的研究較為成熟,而且都與ARMA模型分析有密切關系。回歸分析 如果時間序列x(t)可表示為確定性分量φ(t)與隨機性分量ω(t)之和,根據樣本值x(1),x(2),…,x(T)來估計φ(t)及分析ω(t)的統計規律,屬於時間序列分析中的回歸分析問題。它與經典回歸分析不同的地方是,ω(t)一般不是獨立同分布的,因而在此必須涉及較多的隨機過程知識。當φ(t)為有限個已知函數的未知線性組合時,即 ,式中ω(t)是均值為零的平穩序列,α1,α2,…,αs是未知參數,φ1(t),φ2(t),…,φs(t)是已知的函數,上式稱為線性回歸模型,它的統計分析已被研究得比較深入。前面敘述的降雨量一例,便可用此類模型描述。回歸分析的內容包括:當ω(t)的統計規律已知時,對參數α1,α2,…,αs進行估計,預測x(T+l)之值;當ω(t)的統計規律未知時,既要估計上述參數,又要對ω(t)進行統計分析,如譜分析、模型分析等。在這些內容中,一個重要的課題是:在相當廣泛的情況下,證明 α1,α2,…,αs的最小二乘估計,與其線性最小方差無偏估計一樣,具有相合性和漸近正態分布性質。最小二乘估計姙j(1≤j≤s)不涉及ω(t)的統計相關結構,是由數據x(1),x(2),…,x(T)直接算出,由此還可得(t)進行時間序列分析中的各種統計分析,以代替對ω(t)的分析。在理論上也已證明,在適當的條件下,這樣的替代具有滿意的漸近性質。由於ω(t)的真值不能直接量測,這些理論結果顯然有重要的實際意義。這方面的研究仍在不斷發展。
時間序列分析中的最優預測、控制與濾波等方面的內容見平穩過程條。近年來多維時間序列分析的研究有所進展,並應用到工業生產自動化及經濟分析中。此外非線性模型統計分析及非參數統計分析等方面也逐漸引起人們的注意。
『貳』 時間序列模型和神經網路模型有何區別
時間序列模型是指採用某種演算法(可以是神經網路、ARMA等)模擬歷史數據,找出其中的變化規律,
神經網路模型是一種演算法,可以用於分類、聚類、預測等等不用領域;
兩者一個是問題模型,一個是演算法模型
『叄』 用時間序列的知識回答簡述如何檢驗一個模型的有效性
為了得到正確的結論、在進行系統分析、預測和輔助決策時,必須保證模型能夠准確地反映實際系統並能在計算機上正確運行.因此,必須對模型的有效性進行評估.模型有效性評估主要包括模型確認和模型驗證兩部分內容:模型確認考察的是系統模型(所建立的模型)與被模擬系統(研究對象)之間的關系,模型驗證考察的則是系統模型與模型計算機實現之間的關系.
對於一個具體的建模項目來說,模型有效性評估貫穿於研究的始終.必須指出,模型實際上是所研究的系統的一種抽象表述形式,要驗證一個模型是否百分之百有效是極其困難的,也是沒有實際意義的.另外,模型是否有效是相對於研究目的以及用戶需求而言的.在某些情況下,模型達到60%的可信度使可滿足要求;而在另外一些情況下,模型達到99%都可能是不滿足的.
模型有效性的概念出現在20世紀60年代,隨著計算機模擬技術在各個學科和工程領域的普遍應用,模型有效性問題日益受到人們的關注. 1967年,美國蘭德公司的fishman和Kivtat明確指出,模型有效性研究可劃分為兩個部分:模型的確認(validation)和驗證(verification).這一觀點被國際模擬學界普遍採納.模型確認指通過比較在相同輸入條判和運行環境下模型與實際系統輸出之間的一致性,評價模型的可信度或可用性.模型驗證則是判斷模型的計算機實現是否正確.
盡管確認和驗證在各文獻中的定義不盡相同,但對於二者之間的區別,專家的看法卻是基本一致的.簡單地說,模型確認強調理論模型與實際系統之間的一致性,模型驗證則強調當前模型與計算機程序之間的一致性.在有些文獻中也採用工程技術人員容易接受的「校模」和「驗模」兩個術語來分別代替「確認」和「驗證」.模型的確認和驗證與建模的關系見圖 8.5.
在圖 8.5中,「問題實體」指被建模的對象,如系統、觀念、政策、現象等.「理論模型」是為達到某種特定的研究目的而對問題實體進行的數學/邏輯描述.「計算機模型」(computerized Model)是理論模型在計算機上的實現.
通過「分析與建模」活動可以建立理論模型.計算機模型的建立需通過「編程及實現」這一步驟來完成.經過模擬「實驗」即可得到關於問題實體的結果.
模型確認包括理論模型有效性確認、數據有效性確認和運行有效性確認三部分內容,其中運行有效性確認是模型確認的核心.
圖 8.5 確認和驗證與建模的關系
1)理論模型有效性確認
理論模型有效性確認是對理論模型中採用的理論依據和假設條件的正確性以及理論模型對問題實體描述的合理性加以證實的過程.理論模型有效性確認包括兩項內容:
(1)檢驗模型的理論依據及假設條件的正確性.它具有兩個含義,一是檢驗理論依據的應用條件是否滿足,如線性、正態性、獨立性、靜態性等;該檢驗過程可以利用統計方法進行.二是檢驗各種理論的應用是否正確.
(2)子模型的劃分及其與總模型的關系是否合理,即分析模型的結構是否正確,子模型問的數學/邏輯關系是否與問題實體相符.理論模型經確認有效後,才能對其進行試運行.最後根據輸出結果評估模型的精度.若理論模型無效,應重復分析、建模及確認的過程.
2)數據有效性確認
數據有效性確認用於保證模型建立、評估、檢驗和實驗所用的數據是充分的和正確的.
在模型開發過程中,數據用於模型的建立、校驗和運行.充分、正確、精確的數據是建立模型的基礎.數據有效性確認包括對模型中關鍵變數、關鍵參數及隨機變數的確認,以及對運行有效性確認時所使用的參數和初始值等數據的確認.
3)運行有效性確認
運行有效性確認指就模型開發目的或用途而言,模型在其預期應用范圍內的輸出行為是否有足夠的精度.
運行有效性確認的目的是對模型輸出結果的精度進行計算和評估.其前提是實際系統及其可比系統的數據均可獲取.通過比較模型和實際系統在相同初始條件下的輸出數據,可對模型有效性進行定量分析.與實際系統相類似的系統,確認為有效的解析模型、工程計算模型、以及經過確認的模型都可作為模型的可比系統.
理論模型確認、數據有效性確認及模型驗證是運行有效性確認的前提.經運行有效性確認被認為有效的模型即可作為正式模型投入運行,利用它進行實際問題的研究.若模型在運行有效性確認時被確認為無效,其原因可能是理論模型不正確、或計算機模型不正確,也可能是數據無效.具體原因的查明需從分析與建模階段開始,重復模型的構造過程.若實際系統及其可比系統不存在或完全不可觀測,則模型與系統的輸出數據無法進行比較.在這種情況下,一般只能通過模型驗證和理論模型確認,定性地分析模型的有效性.
理論模型有效性包括:1)表觀確認,分析對與模型有關的所有信息進行評估,確定需要附加分析的內容,以提高模型的可信度水平;2)歷史分析,對與模型有關的歷史信息的評估,以評價模型對預期應用的適宜性.3)預期應用和需求分析,對預期應用的效果進行評估,以確定那些對資源的有效利用起關鍵作用的需求.4)模型概念和逼真度分析,對模型的演算法和子模型進行評估,以辨識那些不適用的假設,並確定子模型的逼真度是否能保證模型的預期應用.5)邏輯追蹤分析,通過模型邏輯評估模型中指定實體的行為,並確定這些行為是否都是所期望的.
『肆』 怎麼利用svm對時間序列進行建模
SVM理論是在統計學習理論的基礎上發展起來的,由於統計學習理論和SVM方法對有限樣本情況下模式識別中的一些根本性的問題進行了系統的理論研究,很大程度上解決了以往的機器學習中模型的選擇與過學習問題、非線性和維數災難、局部極小點問題等。應用SVM進行回歸預測的步驟具體如下:
1)實驗規模的選取,決定訓練集的數量、測試集的數量,以及兩者的比例;2)預測參數的選取;3)對實驗數據進行規范化處理;4)核函數的確定;5)核函數參數的確定。其中參數的選擇對SVM的性能來說是十分重要的,對於本文的核函數使用RBF核函數,對於RBF核函數,SVM參數包括折衷參數C、核寬度C和不敏感參數E。目前SVM方法的參數、核函數的參數選擇,在國際上都還沒有形成統一的模式,也就是說最優SVM演算法參數選擇還只能是憑借經驗、實驗對比、大范圍的搜尋和交叉檢驗等進行尋優。實際應用中經常為了方便,主觀設定一個較小的正數作為E的取值,本文首先在C和C的一定范圍內取多個值來訓練,定下各個參數取值的大概范圍,然後利用留一法來具體選定參數值
股價時間序列的SVM模型最高階確定
股價數據是一個時間序列,從時間序列的特徵分析得知,股價具有時滯、後效性,當天的股價不僅還與當天各種特徵有關,還與前幾天的股價及特徵相關,所以有必要把前幾天的股價和特徵作為自變數來考慮。最高階確定基本原理是從低階開始對系統建模,然後逐步增加模型的階數,並用F檢驗對這些模型進行判別來確定最高階n,這樣才能更客觀反映股票價格的時滯特性。具體操作步驟如下:假定一多輸入單輸出回歸模型有N個樣本、一個因變數(股價)、m- 1個自變數(特徵),由低階到高階遞推地採用SVM模型去擬合系統(這兒的拓階就是把昨天股價當做自變數,對特徵同時拓階),並依次對相鄰兩個SVM模型採用F檢驗的方法判斷模型階次增加是否合適[ 7]。對相鄰兩模型SVM ( n)和SVM ( n+ 1)而言,有統計量Fi為:Fi=QSVR (n)- QSVR( n+1)QSVR (n)1N - m n - (m -1)mi =1,2,,, n(1)它服從自由度分別為m和(N - m n - (m -1) )的F分布,其中QSVR (n)和QSVR( n+1)分別為SVR ( n)和QSVR( n+1)的剩餘離差平方和,若Fi< F(?,m, N-m n- (m-1) ),則SVM (n )模型是合適的;反之,繼續拓展階數。
前向浮動特徵篩選
經過上述模型最高階數的確定後,雖然確定了階數為n的SVM模型,即n個特徵,但其中某些特徵對模型的預測精度有不利影響,本文採用基於SVM和留一法的前向浮動特徵特徵篩選演算法選擇對提高預測精度有利影響的特徵。令B= {xj: j=1,2,,, k}表示特徵全集, Am表示由B中的m個特徵組成的特徵子集,評價函數MSE (Am)和MSE (Ai) i =1,2,,, m -1的值都已知。本文採用的前向浮動特徵篩選演算法如下[9]:1)設置m =0, A0為空集,利用前向特徵篩選方法尋找兩個特徵組成特徵子集Am(m =2);2)使用前向特徵篩選方法從未選擇的特徵子集(B -Am)中選擇特徵xm +1,得到子集Am+1;3)如果迭代次數達到預設值則退出,否則執行4);4)選擇特徵子集Am+1中最不重要的特徵。如果xm+1是最不重要的特徵即對任意jXm +1, J (Am +1- xm+1)FJ(Am +1- xj)成立,那麼令m = m +1,返回2) (由於xm+1是最不重要的特徵,所以無需從Am中排除原有的特徵);如果最不重要的特徵是xr( r =1,2,,, m )且MSE (Am+1- xr) < MSE (Am)成立,排除xr,令A'm= Am+1- xr;如果m =2,設置Am= A'm,J (Am) = J (A'm), ,返回2),否則轉向步驟5);5)在特徵子集A'm中尋找最不重要的特徵xs,如果MSE (A'm- xs)EM SE (Am-1),那麼設置Am= A'm, MSE (Am)= MSE (A'm),返回2);如果M SE (A'm- xs) < M SE (Am -1),那麼A'm從中排除xs,得到A'm-1= Am- xs,令m = m -1;如果m =2,設置Am= A'm, MSE (Am) = MSE (A'm)返回2),否則轉向5)。最後選擇的特徵用於後續建模預測。
預測評價指標及參比模型
訓練結果評估階段是對訓練得出的模型推廣能力進行驗證,所謂推廣能力是指經訓練後的模型對未在訓練集中出現的樣本做出正確反應的能力。為了評價本文模型的優劣,選擇BPANN、多變數自回歸時間序列模型( CAR)和沒有進行拓階和特徵篩選的SVM作為參比模型。採用均方誤差(mean squared error, MSE)和平均絕對誤差百分率(mean ab-solute percentage error, MAPE)作為評價指標。MSE和MAP定義如下:M SE=E(yi- y^i)2n( 2)MAPE=E| yi- y^i| /yin( 3)其中yi為真值, y^i為預測值, n為預測樣本數。如果得出M SE, MAPE結果較小,則說明該評估模型的推廣能力強,或泛化能力強,否則就說明其推廣能力較差
『伍』 如何在Python中用LSTM網路進行時間序列預測
時間序列模型
時間序列預測分析就是利用過去一段時間內某事件時間的特徵來預測未來一段時間內該事件的特徵。這是一類相對比較復雜的預測建模問題,和回歸分析模型的預測不同,時間序列模型是依賴於事件發生的先後順序的,同樣大小的值改變順序後輸入模型產生的結果是不同的。
舉個栗子:根據過去兩年某股票的每天的股價數據推測之後一周的股價變化;根據過去2年某店鋪每周想消費人數預測下周來店消費的人數等等
RNN 和 LSTM 模型
時間序列模型最常用最強大的的工具就是遞歸神經網路(recurrent neural network, RNN)。相比與普通神經網路的各計算結果之間相互獨立的特點,RNN的每一次隱含層的計算結果都與當前輸入以及上一次的隱含層結果相關。通過這種方法,RNN的計算結果便具備了記憶之前幾次結果的特點。
典型的RNN網路結構如下:
4. 模型訓練和結果預測
將上述數據集按4:1的比例隨機拆分為訓練集和驗證集,這是為了防止過度擬合。訓練模型。然後將數據的X列作為參數導入模型便可得到預測值,與實際的Y值相比便可得到該模型的優劣。
實現代碼
時間間隔序列格式化成所需的訓練集格式
這里的輸入數據來源是csv文件,如果輸入數據是來自資料庫的話可以參考這里
LSTM網路結構搭建
這里寫的只涉及LSTM網路的結構搭建,至於如何把數據處理規范化成網路所需的結構以及把模型預測結果與實際值比較統計的可視化,就需要根據實際情況做調整了。
『陸』 年限比較少的時間序列分析用什麼方法
時間序列分析
編輯
時間序列分析(Time series analysis)是一種動態數據處理的統計方法。該方法基於隨機過程理論和數理統計學方法,研究隨機數據序列所遵從的統計規律,以用於解決實際問題。
目錄
1簡介
2參考
3組成要素
4基本步驟
5主要用途
▪ 系統描述
▪ 系統分析
▪ 預測未來
▪ 決策和控制
6具體演算法
1簡介編輯
它包括一般統計分析(如自相關分析,譜分析等),統計模型的建立與推斷,以及關於時間序列的最優預測、控制與濾波等內容。經典的統計分析都假定數據序列具有獨立性,而時間序列分析則側重研究數據序列的互相依賴關系。後者實際上是對離散指標的隨機過程的統計分析,所以又可看作是隨機過程統計的一個組成部分。例如,記錄了某地區第一個月,第二個月,……,第N個月的降雨量,利用時間序列分析方法,可以對未來各月的雨量進行預報。
隨著計算機的相關軟體的開發,數學知識不再是空談理論,時間序列分析主要是建立在數理統計等知識之上,應用相關數理知識在相關方面的應用等。
2參考編輯
參考自:科學技術方法大辭典
時間序列是按時間順序的一組數字序列。時間序列分析就是利用這組數列,應用數理統計方法加以處理,以預測未來事物的發展。時間序列分析是定量預測方法之一,它的基本原理:一是承認事物發展的延續性。應用過去數據,就能推測事物的發展趨勢。二是考慮到事物發展的隨機性。任何事物發展都可能受偶然因素影響,為此要利用統計分析中加權平均法對歷史數據進行處理。該方法簡單易行,便於掌握,但准確性差,一般只適用於短期預測。時間序列預測一般反映三種實際變化規律:趨勢變化、周期性變化、隨機性變化。
時間序列分析是根據系統觀測得到的時間序列數據,通過曲線擬合和參數估計來建立數學模型的理論和方法。它一般採用曲線擬合和參數估計方法(如非線性最小二乘法)進行。時間序列分析常用在國民經濟宏觀控制、區域綜合發展規劃、企業經營管理、市場潛量預測、氣象預報、水文預報、地震前兆預報、農作物病蟲災害預報、環境污染控制、生態平衡、天文學和海洋學等方面。
3組成要素編輯
一個時間序列通常由4種要素組成:趨勢、季節變動、循環波動和不規則波動。
趨勢:是時間序列在長時期內呈現出來的持續向上或持續向下的變動。
季節變動:是時間序列在一年內重復出現的周期性波動。它是諸如氣候條件、生產條件、節假日或人們的風俗習慣等各種因素影響的結果。
循環波動:是時間序列呈現出得非固定長度的周期性變動。循環波動的周期可能會持續一段時間,但與趨勢不同,它不是朝著單一方向的持續變動,而是漲落相同的交替波動。
不規則波動:是時間序列中除去趨勢、季節變動和周期波動之後的隨機波動。不規則波動通常總是夾雜在時間序列中,致使時間序列產生一種波浪形或震盪式的變動。只含有隨機波動的序列也稱為平穩序列。
4基本步驟編輯
時間序列建模基本步驟是:
①用觀測、調查、統計、抽樣等方法取得被觀測系統時間序列動態數據。
②根據動態數據作相關圖,進行相關分析,求自相關函數。相關圖能顯示出變化的趨勢和周期,並能發現跳點和拐點。跳點是指與其他數據不一致的觀測值。如果跳點是正確的觀測值,在建模時應考慮進去,如果是反常現象,則應把跳點調整到期望值。拐點則是指時間序列從上升趨勢突然變為下降趨勢的點。如果存在拐點,則在建模時必須用不同的模型去分段擬合該時間序列,例如採用門限回歸模型。
③辨識合適的隨機模型,進行曲線擬合,即用通用隨機模型去擬合時間序列的觀測數據。對於短的或簡單的時間序列,可用趨勢模型和季節模型加上誤差來進行擬合。對於平穩時間序列,可用通用ARMA模型(自回歸滑動平均模型)及其特殊情況的自回歸模型、滑動平均模型或組合-ARMA模型等來進行擬合。當觀測值多於50個時一般都採用ARMA模型。對於非平穩時間序列則要先將觀測到的時間序列進行差分運算,化為平穩時間序列,再用適當模型去擬合這個差分序列。
5主要用途編輯
系統描述
根據對系統進行觀測得到的時間序列數據,用曲線擬合方法對系統進行客觀的描述。
系統分析
當觀測值取自兩個以上變數時,可用一個時間序列中的變化去說明另一個時間序列中的變化,從而深入了解給定時間序列產生的機理。
預測未來
一般用ARMA模型擬合時間序列,預測該時間序列未來值。
決策和控制
根據時間序列模型可調整輸入變數使系統發展過程保持在目標值上,即預測到過程要偏離目標時便可進行必要的控制。
6具體演算法編輯
用隨機過程理論和數理統計學方法,研究隨機數據序列所遵從的統計規律,以用於解決實際問題。由於在多數問題中,隨機數據是依時間先後排成序列的,故稱為時間序列。它包括一般統計分析(如自相關分析、譜分析等),統計模型的建立與推斷,以及關於隨機序列的最優預測、控制和濾波等內容。經典的統計分析都假定數據序列具有獨立性,而時間序列分析則著重研究數據序列的相互依賴關系。後者實際上是對離散指標的隨機過程的統計分析,所以又可看作是隨機過程統計的一個組成部分。例如,用x(t)表示某地區第t個月的降雨量,{x(t),t=1,2,…}是一時間序列。對t=1,2,…,T,記錄到逐月的降雨量數據x(1),x(2),…,x(T),稱為長度為T的樣本序列。依此即可使用時間序列分析方法,對未來各月的雨量x(T+l)(l=1,2,…)進行預報。時間序列分析在第二次世界大戰前就已應用於經濟預測。二次大戰中和戰後,在軍事科學、空間科學和工業自動化等部門的應用更加廣泛。
就數學方法而言,平穩隨機序列(見平穩過程)的統計分析,在理論上的發展比較成熟,從而構成時間序列分析的基礎。
頻域分析 一個時間序列可看成各種周期擾動的疊加,頻域分析就是確定各周期的振動能量的分配,這種分配稱為「譜」,或「功率譜」。因此頻域分析又稱譜分析。譜分析中的一個重要統計量是 ,稱為序列的周期圖。當序列含有確定性的周期分量時,通過I(ω)的極大值點尋找這些分量的周期
公式
,是譜分析的重要內容之一。在按月記錄的降雨量序列中,序列x(t)就可視為含有以12為周期的確定分量,所以序列x(t)可以表示為 ,它的周期圖I(ω)處有明顯的極大值。
當平穩序列的譜分布函數F(λ)具有譜密度ƒ(λ)(即功率譜)時,
公式
可用(2π)-1I(λ)去估計ƒ(λ),它是ƒ(λ)的漸近無偏估計。如欲求ƒ(λ)的相合估計(見點估計),可用I(ω)的適當的平滑值去估計ƒ(λ),常用的方法為譜窗估計即取ƒ(λ)的估計弮(λ)為 ,式中wt(ω)稱為譜窗函數。譜窗估計是實際應用中的重要方法之一。譜分布F(λ)本身的一種相合估計可由I(ω)的積分直接獲得,即 。研究以上各種估計量的統計性質,改進估計方法,是譜分析的重要內容。
公式
時域分析 它的目的在於確定序列在不同時刻取值的相互依賴關系,或者說,確定序列的相關結構。這種結構是用序列的自相關函0,1,…)來描述的,為序列的自協方差函數值,m=Ex(t)是平穩序列的均值。常常採用下列諸
公式
式給出m,γ(k),ρ(k)的估計: ,通(k)了解序列的相關結構,稱為自相關分析。研究它們的強、弱相合性及其漸近分布等問題,是相關分析中的基本問題。
公式
模型分析 20世紀70年代以來,應用最廣泛的時間序列模型是平穩自回歸-滑動平均模型 (簡稱ARMA模型)。其形狀為: 式中ε(t)是均值為零、方差為σ2的獨立同分布的隨機序列;和σ2為模型的參數,它們滿足: 對一切|z|≤1的復數z成立。p和q是模型的階
公式
數,為非負整數。特別當q=0時,上述模型稱為自回歸模型;當p=0時, 稱為滑動平均模型。根據x(t)的樣本值估計這些參數和階數,就是對這種模型的統計分析的內容。對
公式
於滿足ARMA模型的平穩序列,其線性最優預測與控制等問題都有較簡捷的解決方法,尤其是自回歸模型,使用更為方便。G.U.尤爾在1925~1930年間就提出了平穩自回歸
公式
的概念。1943年,Η.Β.曼和Α.瓦爾德發表了關於這種模型的統計方法及其漸近性質的一些理論結果。一般ARMA模型的統計分析研究,則是20世紀60年代後才發展起來
公式
的。特別是關於p,q值的估計及其漸近理論,出現得更晚些。除ARMA模型之外,還有其他的模型分析的研究,其中以線性模型的研究較為成熟,而且都與ARMA模型分析有密切關系。
公式
公式
回歸分析 如果時間序列x(t)可表示為確定性分量φ(t)與隨機性分量ω(t)之和,根據樣本值x(1),x(2),…,x(T)來估計φ(t)及分析ω(t)的統計規律,屬於時間序列分析中的回歸分析問題。它與經典回歸分析不同的地方是,ω(t)一般不
公式
是獨立同分布的,因而在此必須涉及較多的隨機過程知識。當φ(t)為有限個已知函數的未知線性組合時,即 ,式中ω(t)是均值為零的平穩序列,α1,α2,…,αs是未知參數,φ1(t),φ2(t),…,φs(t)是已知的函數,上式稱為線性回歸模型,它的統計分析已被研究得比較深入。前面敘述的降雨量一例,便可用此類模型描述。回歸分析的內容包括:當ω(t)的統計規律已知時,對參數α1,α2,…,αs進行估計,預測x(T+l)之值;當ω(t)的統計規律未知時,既要估計上述參數,又要對ω(t)
公式
進行統計分析,如譜分析、模型分析等。在這些內容中,一個重要的課題是:在相當廣泛的情況下,證明 α1,α2,…,αs的最小二乘估計,與其線性最小方差無偏估計一樣,具有相合性和漸近正態分布性質。最小二乘估計姙j(1≤j≤s)不涉及ω(t)的統計相關結構,是由數據x(1),x(2),…,x(T)直接算出,由此還可得公式(t)
公式
進行時間序列分析中的各種統計分析,以代替對ω(t)的分析。在理論上也已證明,在適當的條件下,這樣的替代具有滿意的漸近性質。由於ω(t)的真值不能直接量測,這些理論結果顯然有重要的實際意義。這方面的研究仍在不斷發展。
時間序列分析中的最優預測、控制與濾波等方面的內容見平穩過程條。近年來多維時間序列分析的研究有所進展,並應用到工業生產自動化及經濟分析中。此外非線性模型統計分析及非參數統計分析等方面也逐漸引起人們的注意。
『柒』 狀態空間模型的狀態空間模型的時間序列預測的優點
基於狀態空間模型的時間序列預測的優點是: 狀態空間模型求解演算法的核心是Kalman濾波,Kalman濾波是在時刻t基於所有可得到的信息計算狀態向量的最理想的遞推過程。當擾動項和初始狀態向量服從正態分布時,Kalman濾波能夠通過預測誤差分解計算似然函數,從而可以對模型中的所有未知參數進行估計,並且當新的觀測值一旦得到,就可以利用Kalman濾波連續地修正狀態向量的估計。