❶ 如何用stata進行時間序列的協整檢驗,需要具體的操作指令和解釋。
1、首先打開筆者准備 的數據集,然後觀察對數據集進行初步的觀察。通過觀察可以得知t是時間變數,第一步應該設定變數t為時間表示。
❷ 怎麼用STATA檢驗時間序列數據的異方差和自相關
一般來講,時間序列數據較少出現異方差現象,更多地是序列相關問題。
用stata軟體實現異方差的檢驗,最直觀的是用圖示法。作出殘差關於某一解釋變數的散點圖,具體的命令如下:
reg
被解釋變數名
解釋變數名
prrdict
e,
resid
graph
twoway
scatter
e
解釋變數名
此外,還有white檢驗、G-Q檢驗和Breuch-Pagan
LM檢驗。white檢驗不是stata官方的命令,需要單獨下載補丁,G-Q檢驗則需要對變數有較多的先驗認識。我重點介紹一下B-P
LM檢驗在stata中的實現:
在執行完回歸指令regress以後,用
hettest
變數名
這個命令就能實現。其中變數名只包括除常數項以外的所有解釋變數名稱。你可以逐個命令進行操作,也可以用批處理的方式來實現。至於檢驗的原理不用在這里說了吧?不太明白的話建議查查書。
序列相關性的檢驗
1、D-W檢驗
reg
y
x1
x2
x3
estat
dwatson
(y為被解釋變數
x為解釋變數,執行上述命令便可得到D-W值,不過該檢驗存在無法判斷的盲區且只能對一階自相關進行檢驗)
2、Box
and
Pierce's
Q
檢驗
reg
y
x1
x2
x3
predict
e,
resid
wntestq
e,
lags(n)
(n為滯後階數,可以由少及多嘗試幾次)
❸ 如何使用stata進行時間序列的平穩性檢驗如題
用stata進行平穩性檢驗的方法: 1、點擊面板上的額ADF檢驗 2、在打開的對話框中輸入命令dfuller,就開始了平穩性檢驗 Stata 是一套提供其使用者數據分析、數據管理以及繪制專業圖表的完整及整合性統計軟體。它提供許許多多功能,包含線性混合模型、均衡重復反復及多項式普羅比模式。 Stata 的統計功能很強,除了傳統的統計分析方法外,還收集了近 20 年發展起來的新方法,如 Cox 比例風險回歸,指數與 Weibull 回歸,多類結果與有序結果的 logistic 回歸, Poisson 回歸,負二項回歸及廣義負二項回歸,隨機效應模型等。
❹ 用stata怎麼對時間序列進行格蘭傑檢驗,需要具體的命令,非常感謝!
在進行var估計後
輸入vargranger
如:var y x,lags(1/2)
vargranger
詳細地,help vargranger查看
❺ 怎麼在stata裡面設置時間序列變數
比如生成年代變數:tsset year, yearly
比如從1995年開始產生時間序列gen time=m(1995m7)+_n-1
細節可以看tsset幫助
❻ 請問STATA里sort,tsset的指令是什麼意思
sort指令是STATA資料庫的維護的排序指令。tsset是定義數據是一個時間序列數據。如果想對數據文件定義year為時間變數,則輸入命令:tsset year。
Stata 是一套提供其使用者數據分析、數據管理以及繪制專業圖表的完整及整合性統計軟體。它提供許許多多功能,包含線性混合模型、均衡重復反復及多項式普羅比模式。
(6)stata時間序列命令擴展閱讀
統計功能
Stata的統計功能很強,除了傳統的統計分析方法外,還收集了近20年發展起來的新方法,如Cox比例風險回歸,指數與Weibull回歸,多類結果與有序結果的logistic回歸,Poisson回歸,負二項回歸及廣義負二項回歸,隨機效應模型等。具體說, Stata具有如下統計分析能力:
數值變數資料的一般分析:參數估計,t檢驗,單因素和多因素的方差分析,協方差分析,交互效應模型,平衡和非平衡設計,嵌套設計,隨機效應,多個均數的兩兩比較,缺項數據的處理,方差齊性檢驗,正態性檢驗,變數變換等。
分類資料的一般分析:參數估計,列聯表分析 ( 列聯系數,確切概率 ) ,流行病學表格分析等。
等級資料的一般分析:秩變換,秩和檢驗,秩相關等
相關與回歸分析:簡單相關,偏相關,典型相關,以及多達數十種的回歸分析方法,如多元線性回歸,逐步回歸,加權回歸,穩鍵回歸,二階段回歸,百分位數 ( 中位數 ) 回歸,殘差分析、強影響點分析,曲線擬合,隨機效應的線性回歸模型等。
其他方法:質量控制,整群抽樣的設計效率,診斷試驗評價, kappa等。
❼ stata怎麼做時間序列
//lecture 9
//繪值散點圖並添加圖例:
scatter le year, c(l) xlabel(1990 1918 1940(20)2000, grid) legend(on)
//顯示圖例(自帶的label,並未修改)
//le 變數的標簽 圖例是變數的標簽,所以修改圖例可以先修改標簽
//不改變真正的label
scatter le_male le_female year, c(l) legend(label(1 "Male") label(2 "Female"))
//繪值le_m、le_f 散點圖並添加圖例,將圖例分別改成「male」and「female」
scatter le_male le_female year, c(l) legend(on order(1 "male" 2 "female"))
//和上一行一樣
twoway (line le_male year, lpattern(dash)) (line le_female year, lcolor(red) lpattern(dot)) (line le_w year, lcolor(green)), legend (on order(1 "Male" 2 "Female" 3 "White") col(1) ring(0) pos(4) title("標題") subtitle("子標題"))
//twoway(將幾張圖畫在同一個裡面):展示第一個圖是什麼(),第二是什麼()第三個是什麼。。。。。,用括弧的形式展示出這個圖形是什麼,lpattern是線的形式 dash是虛線 (默認為實線),dot是點,lcolor是線的顏色
//其中pattern必須改 因為列印出黑白分不清顏色
//pos(4)是把圖例放在四點鍾方向(右下角)默認為六點鍾方向, ring(0)是放在圖形裡面 col()是一行放幾個元素
sysuse "auto.dta",clear
scatter mpg weight
//散點圖
twoway(scatter mpg weight if foreign == 0)(scatter mpg weight if foreign == 1) , legend(on order(1 "國產車" 2 "進口車"))
scatter mpg weight, by(foreign)
//以foreign,domestic作區分 與twoway不同,這個是分別獨立做圖 散點圖
scatter mpg weight, by(foreign, total)
//並添加一張包含所有觀測值
scatter mpg weight, by(foreign, total rows(1))
//將繪制的圖形改為一行排列
scatter mpg weight, by(foreign, total holes(3))
//將繪制圖形的留白放在左下方
scatter mpg weight, by(foreign,total title("My Title"))
//將圖形添加一個全標題
scatter mpg weight, subtitle(" ") by(foreign, total title("my title"))
//將每個小圖的標題去掉
scatter mpg weight, subtitle(ring(0) pos(12) nobexpand) by(foreign, total title("my title"))
//將每個圖的小標題位置更改
//如果foreign變數沒有標簽怎麼辦?
label drop origin
scatter mpg weight, by(foreign, total title("My Title"))
label define origin_v 0 "國產" 1 "進口"
label values foreign origin_v
scatter mpg weight, by(foreign, total title("My title"))
twoway (scatter mpg weight if foreign == 0) (scatter mpg weight if foreign == 1, msymbol(x)),legend(order(1 "國產" 2 "進口"))
scatter mpg weight || lfit mpg weight , by(foreign, row(1))
//繪制散點和線性復合圖形,根據foreign分組,添加一個總體圖 排成一行
scatter mpg weight || lfit mpg weight, legend(cols(1) ring(0)) by(foreign, legend(pos(4)))
//將圖例變為一列顯示,放置四點鍾方向
scatter mpg weight || lfit mpg weight ||,legend(rows(1)) by(foreign, total legend(at(3) pos(0)))
//將圖例放在2x2的留白處
scatter mpg weight || lfit mpg weight ||, by(foreign, total legend(off))
//將圖例放在2x2的留白處
//scheme選項
help scheme
//軸線選擇選項
help axis_choice_options
//example
sysuse auto,clear
scatter mpg price weight
//繪制散點圖,要求兩個y軸變數共用y軸
twoway (scatter mpg weight) (scatter price weight)
//一樣
twoway (scatter mpg weight) (scatter price weight, yaxis(2))
//繪制散點圖,並使用兩個y軸
twoway ( scatter mpg weight ) (scatter price weight, yaxis(2)), xlabel(1000(500)5000) ytick(#10, axis(2)) ylabel(#8, axis(1))
//每一個坐標軸添加刻度和標識,x軸大約10個刻度,左邊的y軸大約8個刻度,右邊的大約10個刻度
//添加軸線選項
help added_line_options
//圖形保存選項
sysuse auto,clear
help area
sysuse gnp96, clear
graph twoway area d.gnp96 date
//時間序列數據
gen dev_gnp = gnp96 - l.gnp96
twoway(line gnp96 date) (area d.gnp96 date, yaxis(2))
twoway(line gnp96 date) (area dev_gnp date, yaxis(2))
twoway(line gnp96 date) (line dev_gnp date, lpattern(dot) lcolor(1))
//繪制如下復雜圖:
graph use area_gnp
sysuse gnp96,clear
#delimit ;
twoway area d.gnp96 date, xlabel(#20, angle(90))
ylabel(-100(50)200,angel(0))
ytitle("Billions of 1996 Dollars")
xtitle("")
subtitle("Change in US GNP",pos(11))
note("Source: US Department of Commerce, Bureau of Economics")
;
#delimit cr
//換行功能換回回車
graph save area_gp, replace
//lecture 10
sysuse lifeexp, clear
help histogram
//直方圖📊,主要繪制連續變數,密度圖,還要乘以寬度才是頻數
twoway histogram le
//le是lexp的簡稱,直方圖描述從多少到多少有多少個
//by 在有0,1變數時候可以用
twoway hist le, bin(10)
twoway hist le, bin(5)
//設置幾個柱子
twoway hist le, width(5)
//設置柱子的寬度
twoway hist le, gap(10)
//柱子之間的間隙
twoway hist le, horizontal
//橫過來,水平直方圖
twoway hist le, percent
//以百分比形式顯示
help graph bar
help graph hbar
//條圖,主要繪制離散變數
sysuse citytemp, clear
graph bar (mean) tempjuly tempjan
graph bar tempjuly tempjan, over(region)
//默認設置為均值,按照地區(東南西北)劃分
graph bar tempjuly tempjan, over(region) bargap(30)
//兩個柱狀之間的位置可以調,可以重疊,也可以分開一點 -30代表重疊 30代表分開
graph bar tempjuly tempjan, over(region) stack
//可以把兩個變數堆積在一起,一般堆積的是個數 均值沒啥意義
graph bar tempjuly tempjan, over(division)
//數據中有兩個分類變數,可以根據division再分類
tab division if region == 1
tab division if region == 2
graph bar tempjan, over(division) over(region)
//每一個region下又分幾個division
graph bar tempjuly tempjan, over(region, gap(10))
//條與條之間的間隔
graph bar tempjuly tempjan, over(region, descending)
//數據中west是4 所以按4321排列
graph bar tempjuly tempjan, by(region)
//按region分別繪制四個圖
//圖形保存選項:
sysuse auto,clear
scatter mpg price weight
graph save fig1, replace
graph use fig1
//讀取已存儲圖形
graph export fig1.png, replace
//運行時要保證scatter mpg price weight 這個圖是打開的 否則運行不了
cd /Victor/stata
//電子地圖:
findit spmap
help spmap
unicode encoding set gb18030
unicode translate "china_label.dta"
//必須先清零數據,然後運行一遍路徑名 才能運行這兩行命令
use "china_label.dta", clear
//example 1
use china_label, clear
gen xx = uniform()
spmap xx using "china_map.dta", id(id) title("中國地圖",size(*0.8)) label(label(ename) xcoord(x_coord) ycoord(y_coord) size(*.8)) plotregion(icolor(stone)) graphregion(icolor(stone)) fc(Greens) clnumber(8) oc(white ..) osize(medthin ..)
//clnumbers 代表8種不同的綠色
//example 2
tab name
replace name = subinstr(name, "省", "", .)
replace name = subinstr(name, "市", "", .)
replace name = subinstr(name, "回族自治區", "", .)
replace name = subinstr(name, "壯族自治區", "", .)
replace name = subinstr(name, "特別行政區", "", .)
replace name = subinstr(name, "自治區", "", .)
replace name = subinstr(name, "維吾爾", "", .)
tab name
//改名字
foreach x of numlist 1/5{
gen num`x'=uniform()
}
//產生0到1的隨機數
format x %9.3g
foreach x of numlist 1/5{
spmap `x' using "china_map.dta",id(id) title("中國地圖", size(*0.8)) label(label(ename) xcoord(x_coord) ycoord(y_coord) size(*.8)) plotregion(icolor(stone)) graphregion(icolor(stone)) fc(Greens) clnumber(8) oc(white ..) osize(medthin ..) graph export "china0`x'.png", replace
}
//lecture 11
sysuse auto, clear
summarize mpg weight
//summarize 後面可以接一個或多個變數,個數 均值 最小最大值
summarize mpg, detail
//會有關於數據其他的統計指標
help summarize
tabulate mpg, sort
//離散變數排序之後用表統計
tabulate foreign
//最好是分類變數去tabulate,展示各個種類有多少個,佔多大比例(離散的)
help tabulate
sysuse nlsw88, clear
tab occ
//不同職業的樣本在我的資料庫裡面分別有多少個,比例大小,總的樣本數量是多少
tab instry
sysuse auto, clear
tabstat mpg price weight rep78 , stat(n mean sd min median max) c(s)
//c(s)是轉置過來這個矩陣,默認閱讀方式是:列是統計指標,行是變數名稱
help tabstat
//下劃線是代表可以簡寫,只寫c(s)
//可以規定format 總長度多少個單位,小數點前面,後面有多少個單位,統一成一個格式
tabstat mpg price weight rep78 , by(foreign) stat(n mean sd min median max) c(s)
//by是以什麼分類展示
//輸出表格(不要復制):
ssc install logout
logout, save(summarize) tex word excel dec(3) replace: tabstat mpg price weight rep78 , stat(n mean sd min median max) column(s) long format
//不建議導出成tex word 因為在Excel還要進一步編輯,xml格式的可以在excel打開 rtf是可以從word打開 就可以應用在論文裡面了。replace替換原來的 dec(3)代表小數點後統一保留三位數,replace後面與之前一模一樣 ,column是列
logout, save(summarize) tex word excel dec(3) replace: tabstat mpg price weight rep78 , by(foreign) stat(n mean sd min median max) c(s)
//save(文件名)
use nei_sample.dta, clear
describe
plicates tag newid year, gen(p)
edit newid year if p >= 195
plicates drop newid year, force
help merge
plicates drop newid year, force
//一個地方會有n個企業
merge m:1 fips year using "county_na.dta"
//根據county的代碼和時間調用
//有三部分的merge,merge=1和2是不需要的地方 只保留3(matched) 因為沒有企業的觀測值(0),而merge=1則是有企業的觀測值(1),而merge=2沒有政策的觀測值(0)(觀測到了企業污染,卻沒有觀察到關於政策的變數)
//我們關心企業所在的地區是否有環境政策
//做一個最簡單的回歸,政策對污染的影響:(regress)
foreach v of varlist reg_* {
replace `v'= 0 if `v' == .
}
//將missing變成0
reg co reg_co
gen lco = ln(co)
reg lco reg_co
//有0的問題
//add a set of mmies(虛擬變數), tear , instry, county
gen fips_st = substr(fips,1,2)
//state(截取fips編號的前兩位)
gen sic2 = substr(sic,1,2)
//instry
gen sic1 = substr(sic2,1,1)
keep if sic1 == "2" | sic1 == "3"
//manufacturing only 或
gen lco = log(co)
//generate log
reg lco reg_co
//reg_co代表政府有無監管,有就是1(非常不準)表中的_cons代表截距
xi: reg lco reg_co i.year
//按照年份,每年加一個虛擬變數,是這一年就是一
//with year FE (根據每一年不一樣回歸 )
//年份前的系數是相對於基年的增加或減少,添加年份虛擬變數
//分離出宏觀經濟沖擊的影響
bys year: egen id_sum = count(newid)
//?
xi : reg lco reg_co id_sum i.year
//with year FE, multicolinearity
//如果觀測值是1996年的,那麼iyear1996=1,這個統一的因素會影響所有的企業(宏觀經濟因素,所有企業都受影響),今年的這個企業和明年的這個企業外部環境是不一樣的,是什麼不重要,要capture這個東西
xi : reg lco reg_co i.year i.sic2
//with instry FE(不同產業的影響)
xi : reg lco reg_co i.year i.sic2 i.fips_st
//with state FE(省政府對環境保護的壓力的影響)
xi : reg lco reg_co i.year i.sic2 i.fips
//with county FE
plicates drop newid year, force
xtset newid year
//set panel
xi: reg lco reg_co i.newid
//通過添加mmy
xi: xtreg lco reg_co, fe
//先進行差分 (常用)
//這兩行的結果相同
xi: xtreg lco reg_co i.year , fe
//year
xi: xtreg lco reg_co i.year i.fips_st, fe
//state fe
xi: xtreg lco reg_co i.year i.sic2, fe
//instry fe
//下標都是固定效益 用希臘字母帶下標 c是位置 j是行業 t為第t年的宏觀經濟形勢/技術進步(系統性) i表示企業自身的固定效益,是觀察不到的個體特徵因素(有些企業管理水平天生高,低)
sort newid sic2
by newid: gen newsic2 = sic2[_N]
xi: xtreg lco reg_co i.newsic2, fe
//企業不更改行業屬性
//two-way fised effects with firm fixed effects
xi:xtreg lco reg_co i.teay*i.newsic2, fe
//instry-year FE
xi:xtreg lco reg_co i.teay*i.fips_st, fe
findit outreg2
//默默地回歸quite
qui xi: xtreg lco reg_co i.newsic2,fe
outreg2 using result1.xls,excel keep(reg_co) dec(3) addtext(Firm FE, Y,Stata-Year FE,n,Instry-Year FE,n)
//keep只保留關心的系數,小數點後面保留多少位
//數據批量導入與導出,亂碼處理,變數構造,數據的整理,數據變數的修改,相互轉換
//數據可視化,在統計中summary statistic table 然後在fixeffect model 簡單地看了一下
//將回歸結果用excel報告