⑴ 關於主成分分析的stata操作步驟
先將變數標准化:egen z1 = std(x1)……
進行主成分分析:pca x*, mineigen(1)
主成分載荷分析:estat loading,cnorm(eigen)
效果分析:estat kmo(一般要大於0.7才適合做主成分分析)
碎石圖:screeplot
主成分選擇,一般選擇前幾個方差解釋累計超過80%的因子主成分的因子
⑵ Stata軟體 做主成分分析,如何畫前三個主成份的散點圖呢
貢獻率太低啦
用screeplot就可以實現啦
⑶ 急求,如何用stata做主成分分析,具體步驟及結果怎樣分析
這有具體的步驟,你可以參見這個,如果有數據的話,可以跑一下試試
http://wenku..com/link?url=Xd7s1YrEwtOfTC_goI-S5Kk-KITxjMOppg_uRK0YOwjLocbuJAVoHGpATgWem_WAymkNrm84n84vT1fLDXG791-A6FWbsTLS5MM3KI6GJWu
⑷ 高手幫我解答吧!拜託了!用主成分分析法怎樣將很多數據整合成一個綜合指標,軟體用的是stata.
先做pca分析,然後提取特徵值>1的項,累加其scole,最後得分就是你要的「綜合指標」,沒有單位哦。
⑸ 具體怎麼在STATA中進行主成分分析,比如說有x1~x18個變數怎麼操作
命令pca,具體的使用方法在help-Stata Command中搜索pca命令,打開help文件後,右上角偏下部分有Jump to,點擊後直接跳轉到examples,查看例子,簡單明了。
⑹ 如何用Stata命令消除多重共線性問題
影響
(1)完全共線性下參數估計量不存在
(2)近似共線性下OLS估計量非有效
多重共線性使參數估計值的方差增大,1/(1-r2)為方差膨脹因子(Variance Inflation Factor, VIF)如果方差膨脹因子值越大,說明共線性越強。相反 因為,容許度是方差膨脹因子的倒數,所以,容許度越小,共線性越強。可以這樣記憶:容許度代表容許,也就是許可,如果,值越小,代表在數值上越不容許,就是越小,越不要。而共線性是一個負面指標,在分析中都是不希望它出現,將共線性和容許度聯系在一起,容許度越小,越不要,實際情況越不好,共線性這個「壞蛋」越強。進一步,方差膨脹因子因為是容許度倒數,所以反過來。
總之就是找容易記憶的方法。
(3)參數估計量經濟含義不合理
(4)變數的顯著性檢驗失去意義,可能將重要的解釋變數排除在模型之外
(5)模型的預測功能失效。變大的方差容易使區間預測的「區間」變大,使預測失去意義。
需要注意:即使出現較高程度的多重共線性,OLS估計量仍具有線性性等良好的統計性質。但是OLS法在統計推斷上無法給出真正有用的信息。
判斷方法
如圖,是對德國人口老齡化情況的分析,其中y是老齡化情況,線性回歸的x1、x2、x3分別為人均國內生產總值、出生率、每個醫生平均負擔人口數。
判斷方法1:特徵值,存在維度為3和4的值約等於0,說明存在比較嚴重的共線性。
判斷方法2:條件索引列第3第4的值大於10,可以說明存在比較嚴重的共線性。
判斷方法3:比例方差內存在接近1的數(0.99),可以說明存在較嚴重的共線性。
解決方法
(1)排除引起共線性的變數
找出引起多重共線性的解釋變數,將它排除出去,以逐步回歸法得到最廣泛的應用。
(2)差分法
時間序列數據、線性模型:將原模型變換為差分模型。
(3)減小參數估計量的方差:嶺回歸法(Ridge Regression)。
(4)簡單相關系數檢驗法
⑺ Stata做主成分分析會自動標准化嗎
你要區分變數是正向變數還是負向變數
把變數區分清楚了stata會自動進行標准化處理
⑻ 大神你好 想用STATA 做主成分分析 但是很多英文術語不明白 可以在線指導下嗎
最主要命令就是pca啦
具體操作要結合數據會跟清楚