導航:首頁 > 程序命令 > stata散點圖命令

stata散點圖命令

發布時間:2023-03-01 05:23:28

Ⅰ stata命令有哪些

1、format x1 %10.3f ——將x1的列寬固定為10,小數點後取三位;

2、format x1 %10.3g ——將x1的列寬固定為10,有效數字取三位;

3、format x1 %10.3e ——將x1的列寬固定為10,採用科學計數法;

4、format x1 %10.3fc ——將x1的列寬固定為10,小數點後取三位,加入千分位分隔符;

5、format x1 %10.3gc ——將x1的列寬固定為10,有效數字取三位,加入千分位分隔符;

6、format x1 %-10.3gc ——將x1的列寬固定為10,有效數字取三位,加入千分位分隔符,加入「-」表示左對齊;

7、generate——生成新變數的命令,注意:變數名稱只能用英文和數字,且若名稱中同時有英文和數字,必須以英文開頭。

8、drop——去除變數的命令,如果想把變數z給去掉,那麼可以輸入命令:drop z;

9、twoway (scatter y x)(lfit y x)——畫出擬合線,注意:這個命令最開始的字母twoway也可以簡寫為tw。

10、scatter y x——畫散點圖,注意:在Stata的許多命令中,因變數一般都放在自變數前面。

Ⅱ 普林斯頓Stata教程之Stata做圖

2.1 散點圖

2.2 線圖

2.3 其他圖形

2.4 圖形管理

Stata擁有出色的圖形設備,可通過 graph 命令訪問, help graph 了解概述。統計中最常見的圖表是顯示點或線的雙坐標軸X-Y圖。這可以通過子命令 twoway 實現。 twoway 命令中又含42個子命令及繪圖類型,其中最重要的是 scatter 和 line 。我們將對 scatter 和 line 著重介紹,並簡要介紹其他繪圖類型。

Stata 10引入了一個圖形編輯器,可用於互動式地修改圖形。然而,我不會提倡這種做法,因為它與記錄和確保研究中所有步驟可重復的目標相沖突。

本節中的所有圖表(除非另有說明)都使用帶藍色標題和白色背景的自定義方案,我將在第2.2.5節對方案進行討論。

在本節中,我將使用前文使用過的有關生育率下降的 effort 數據集進行圖表說明。讀取數據:

為了激起你的興趣,先展示我們將在本節中完成的作品:

可以使用以下命令生成生育率變化(change)與社會環境(setting)關系的簡單散點圖:

請注意,首先指定的變數是在Y軸。如果變數有定義標簽,則坐標軸顯示變數標簽名,若無定義則顯示變數名。如果這是唯一的圖,該命令可以縮寫為 twoway scatter ,或者 scatter 。現在我們將添加一些東西。

假設我們也想顯示擬合的回歸線。在某些軟體包中,您需要運行回歸,計算擬合線,然後對其進行繪制。Stata可以使用 lfit 繪圖類型一步完成所有操作(還有一個二次擬合繪圖類型 qfit )。通過將每個子圖封閉在括弧內,可以將它與散點圖結合使用(也可以使用兩條豎線來分隔它們)。

現在假設我們想在回歸線上放置置信區間。Stata可以通過 lfitci 來實現這一點,該繪圖類型將置信區域繪制為灰色帶。(還有一個 qfitci 類型用於二次擬合的頻帶。)因為置信帶會遮蔽一些點,所以我們先繪制該區域再繪制點

請注意,該命令不會標記y軸,而是使用圖例。您可以使用該 ytitle() 選項為y軸指定標簽,並隱藏圖例 legend(off) :

有很多選項可以讓你控制點的標簽,包括它們的形狀和顏色,參見 help marker_options 。使用 mlabel(varname) 選項也可以用變數的值標記點。在下一步中,我們將國名添加到圖中:

標簽中的一個小問題是哥斯大黎加和特立尼達多巴哥(以及巴拿馬和尼加拉瓜)相互重疊。我們可以使用12小時時鍾指定標簽相對於標記的位置來解決這個問題(12是上面的,3是右邊,6是下面,9是在標記的左邊)。
我們創建一個變數,將默認設置的位置保持為3點,然後將哥斯大黎加移動到9點,特立尼達多巴哥移動到11點以上的位置(我們也可以將尼加拉瓜和巴拿馬上移位,到2點方向):

生成此版本圖形的命令如下

有些選項適用於所有雙向圖形,包括標題,標簽和圖例等。Stata圖表的 title() 和 subtitle() 通常在頂部, legend() , note() 和 caption() 通常在底部,更多信息鍵入 help title_options 。通常你只需了解標題即可。Stata 11允許圖形中的文本包括粗體,斜體,希臘字母,數學符號和字體選擇。Stata 14引入了Unicode,大大擴展了可以完成的工作。 help graph text 以了解更多信息。

我們對圖表的最後調整是添加一個圖例來指定線性擬合和95%置信區間。我們使用 order(2 "linear fit" 1 "95% CI") 命令,圖例的選項按照該順序標記第二個和第一個項目。我們還使用 ring(0) 將圖例移動到繪圖區域內,並使用 pos(5) 將圖例框放置在5點鍾位置附近。完整命令就是:

結果就是本節開始處顯示的圖形

有一些選項可以控制軸的縮放比例和范圍,包括 xscale() 和 yscale() 。可以是算術,對數值等。更多信息 help axis_scale_options 。其它選項控制主要和次要記號和標簽,如 xlabel() , xtick() and mtick() ,同樣地,對於y軸,見 help axis_label_options 。通常默認值是可以接受的,但還是很高興您知道它們是可以更改的。

將使用美國預期壽命數據來說明線圖,這試數據Stata附帶的數據集之一(試試 sysuse dir 看看還有什麼可用的)。

我們的目標是繪制20世紀美國白人和黑人男性的預期壽命。為了激發你的興趣,將先向你展示最終成果,然後我們將一點一點地構建圖表。

最簡單的圖形所有參數使用默認值:

如果這就是我們所要的圖形,可以將命令縮寫為 twoway line ,或者 line (只適用於散點圖和線圖)。

線圖允許我們指定多個「y」變數,順序為y1,y2,...,ym,x。本例中,我們指定了兩個——對應於白人男性和黑人男性的預期壽命。或者,我們可以使用兩條線圖: (line le_wmale year) (line le_bmale year) 。

默認圖形很好,但圖例似乎太羅嗦。我們會將大部分信息轉移到標題中,並且只保留膚色信息:

在這里,我使用了三個選項: title , subtitle 和 legend 。 legend 選項有許多子選項; 此處用 order 列出關鍵點(即 1 2 )及其標簽,說明第一條線代表白人,第二條線代表黑人。要省略關鍵點,只需將其從列表中移除即可。其他的圖例選項,請參閱 help legend_option 。

下面我希望在畫圖區域內移動圖例來改善空間,比如說在5點鍾左右的位置有空餘空間。如前所述,我們可以通過使用 ring(0) 將圖例移動到繪圖區域內,並通過 pos(5) 將其置於5點鍾位置附近。因為這些都是圖例子選項,所以都在 legend() 命令括弧中輸入:

我不知道你感覺如何,但我自己很難區分圖畫中的默認線條。Stata中有不同的方式控制線條樣式。 clstyle() 選項可以讓你使用已命名的不同風格,比如 foreground , grid , yxline ,或是根據線1~15使用樣式命名的 p1-p15 ,詳情請參閱 help linestyle 。如果您想根據方案選擇合適樣式元素,這非常有用。

您也可以指定樣式的三個成分從而確定風格:線條樣式,寬度和顏色:

我們將白人指定為藍色,黑人指定為紅色:

請注意,這 clcolor() 是線圖的一個選項,所以我將括弧放在 line 命令的周圍並把 clcolor() 插入那裡。

由上圖我們可以看出,預期壽命的提升速度在20世紀下半葉有所減緩。使用對數刻度可以更直觀的理解,需要注意的是對數刻度中直線表示恆定的改善幅度。這由 help axis_options 可以很容易完成。尤其是 yscale() ,它可以讓你選擇算數( arithmetic ),對數( log )或倒置刻度( reversed )。其中倒置刻度是指y軸是從最大的值開始的,最小值反而在最上方。還有一個子選項 range() 可以控制繪圖范圍。在這里,我將y范圍指定為25到80,以便將曲線稍微向上移動:

Stata使用方案來控制圖的外觀,參見 help scheme 。您可以設置默認方案並在所有圖形中應用 set scheme_name 。您也可以使用不同的方案對所作的最後一個圖形重新展示,選出效果最好的方案 graph display, scheme(scheme_name) 。

使用 graph query, schemes 查看可用方案類型列表。 s2color 方案適用於屏幕圖表, s1manual 是Stata手冊中的風格。 economist 是經濟學人雜志使用的風格。我們可以獲得本節開頭所示的圖形使用的是 economist 風格。

條形圖可用於繪制分類變數的頻數分布,或繪制由分類變數定義的組內連續變數的描述性統計。我們將使用Stata附帶的城市溫度數據集為例說明。

如果我只是鍵入 graph bar, over(region) 我將獲得區域變數的頻數分布。讓我們來展示一月和七月的平均氣溫的區域分布。要做到這一點,我可以指定 (mean) tempjan (mean) tempjuly ,但由於默認統計是平均值,我們可以簡寫如下。我認為默認圖例太長,所以也指定了一個自定義圖例。

我使用 over() 這樣所以區域出現在同一個圖表中;· by() 則相反,每個區域都會產生一個單獨的坐標軸。 bargap() 選項則控制同一個組中不同統計的小節之間的間隔; 在這里我放了一個小空間。 gap() (此處未使用)選項控制不同組別的空間。我還將顏色填充強度設置為70%,我認為這看起來更好。

顯然,1月份東北部和北部中部地區比南部和西部冷得多。七月份的變化較少,但南部的氣溫較高。

使用箱線圖可以快速獲得變數分布的特徵,箱線圖是取值范圍為1~3分位數的箱子,將中位數用橫線顯示,並且在盒子上下方增加了「wiskers」,定義為距離中值不超過四分位數間距的1.5倍的最高和最低值。在wiskers上下方的點用圓圈表示為異常值。

讓我們畫一個地區1月份的溫度箱形圖。我將使用 over(region) 選項,並用 sort(1) 選項控制排列順序——按照第一個變數 tempjan 中位數大小排列。我還通過設定RGB值將顏色設置為藍色:

我們看到,1月份的氣溫在東北部和北部中部地區較低,變化較小,相當一部分城市氣溫異常偏冷。

對變數分布更詳細的展示需要用到平滑直方圖,可以使用 kdensity 命令使用核密度平滑器計算平滑直方圖。

讓我們使用默認設置對每個區域的1月溫度進行單獨的核密度估計,並保存結果。

接下來我們做出核密度估計圖。由於密度圖重疊,我使用Stata 15中引入的不透明選項使它們透明度達到50%。在這種情況下,我使用顏色名稱後面跟著一個%符號和不透明度。我也簡化了圖例,匹配密度的順序,並把它放在圖示的右上角。

這個圖示使我們清楚地看到了1月份氣溫的區域差異,東北部和北部中心地區的氣候分布更冷,更窄,南部和西部的氣候相當相似。

Stata默認在內存中保存您繪制的最後一個圖形,並將其稱為「Graph」。如果你在在創建圖形時使用 name() 為圖形單獨命名,在內存中可以保留多個圖形。這對於組合圖形很有用, help graph combine 了解更多。請注意,即使您保存了數據,保存在內存中的圖表也會在您退出Stata時消失,除非您保存圖形本身。

要使用Stata自己的格式將當前圖形保存到磁碟上,輸入 graph save filename 。該命令有兩個選項 replace 和 asis ,如果該文件已存在,則需要使用 replace 選項替代原有圖形,而 asis 選項會凍結圖形(包括其當前風格),然後將其保存。默認情況下,將圖形保存為可在未來可編輯的實時格式。以Stata格式保存圖形後,可以使用 graph use filename 命令從磁碟載入它。( graph save 和 graph use 類似於 save 和 use )存儲在內存中的任何圖形可以使用 graph display [name] 顯示。 help graph_manipulation 了解更多信息。

如果您打算將圖表合並到另一個文檔中,您可能需要將其保存為更便攜的格式。Stata的命令 graph export filename 可以使用各種矢量或光柵格式導出圖形,通常由文件擴展名指定。您還可以使用 graph print 列印圖形,或使用Windows剪貼板將其復制並粘貼到文檔中。

Ⅲ stata命令匯總是什麼

stata命令匯總如下:

1、input: 輸入數據

例:inpurt x y

2、by: 按照某一變數的取值來進行分析

例:by group,sort: regress Y x1 x2 //按照不同的組,對Y做回歸分析

3、weight: 加權或者頻數

例:fw=頻數變數 //多用在四格表資料中或者原資料未給出所有值,只給出了值和對應的頻數

4、if: 用條件語句指定條件

例:drop if group==1|group==2 //把group變數值為1或者2的記錄刪除掉

5、in:指定觀察值的范圍,對在范圍內的觀察值做分析處理

例:replace x1="123" in 100/200 //把第100-200條記錄中的X1變數值改為123

6、for: 用來指定變數

例:for y1-y10 z1-z5: regress @x1-x22

//把y1-y10,z1-z5分別於x1-x22做回歸,一次性代表15次回歸,其中@是替換符,代表y1-y10, z1-z5

7、函數

abs(x) 絕對值

exp(x) 指數函數

log(x) 自然對數

log10(x) 常用對數

sqrt(x) 平方根

uniform(x) 生成(0,1)內均勻分布的偽隨機數

length(x) 計算長度

substr(s,n1,n2) 獲得從S的n1個字元開始的n2個字元組成的字元串

real(x) 將字元串s轉換為數值函數

trim(x) 去除字元串前面和後面的空格

int(x) 去掉x的小數部分,得到整數

sum(X) 求和

max(x) min(x) 最大值最小值

_n 當前觀察值的位置

_N 觀察值的總個數

8、ren: 重命名

例:ren var1 var123 ,把var1重新命名為var123

9、des:描述資料庫的基本情況

10、label: 為變數添加一些說明,以示說明

11、sort: 按照某一變數從小到大排序

gsort +/-:按照某一變數從大到小或者從小到大排序

sort var1 var2:按照var1大小排序,相同的var1按照var2大小排序

Stata常用功能:

1、統計功能

Stata的統計功能很強,除了傳統的統計分析方法外,還收集了近20年發展起來的新方法,如Cox比例風險回歸,指數與Weibull回歸,多類結果與有序結果的logistic回歸,Poisson回歸,負二項回歸及廣義負二項回歸,隨機效應模型等。

2、作圖功能

Stata的作圖模塊,主要提供如下八種基本圖形的製作 : 直方圖(histogram),條形圖(bar),百分條圖 (oneway),百分圓圖(pie),散點圖(two way),散點圖矩陣(matrix),星形圖(star),分位數圖。

這些圖形的巧妙應用,可以滿足絕大多數用戶的統計作圖要求。在有些非繪圖命令中,也提供了專門繪制某種圖形的功能,如在生存分析中,提供了繪制生存曲線圖,回歸分析中提供了殘差圖等。

3、程序設計

Stata是一個統計分析軟體,但它也具有很強的程序語言功能,這給用戶提供了一個廣闊的開發應用的天地,用戶可以充分發揮自己的聰明才智,熟練應用各種技巧,真正做到隨心所欲。事實上,Stata的ado文件(高級統計部分)都是用Stata自己的語言編寫的。

閱讀全文

與stata散點圖命令相關的資料

熱點內容
fw壓縮圖片 瀏覽:254
淘寶申請源碼靠譜嗎 瀏覽:870
androidupdater 瀏覽:635
c2d游戲源碼大全可復製版 瀏覽:771
電腦怎樣重置網關命令 瀏覽:411
winftplinux 瀏覽:335
推特app界面如何設置成中文 瀏覽:452
太空工程師轉子編程屬性 瀏覽:32
windowscmd關機命令 瀏覽:342
雲桌面只要伺服器裝一套軟體 瀏覽:247
電腦右鍵按到什麼導致文件夾全屏 瀏覽:454
我的世界如何製造伺服器主城 瀏覽:365
linuxssh連不上 瀏覽:297
永宏plc用什麼編程電纜 瀏覽:371
win激活命令行 瀏覽:886
新手學電腦編程語言 瀏覽:893
雲空間在哪個文件夾 瀏覽:926
編程游戲小貓抓小魚 瀏覽:790
安卓dosbox怎麼打開 瀏覽:774
伺服器無影響是怎麼回事 瀏覽:958