❶ 正態分布形成的原理
首先,基本上每個人的學習都是相互獨立的,所以可認為n個人的成績是n個相互獨立的隨機變數X1,X2.....Xn,同時他們具有自己的數學期望和方差(每個人參加多次考試的成績都會有所波動嘛),所以滿足中心極限定理二李雅譜諾夫定理的條件,故無論各個隨機變數服從什麼分布,在滿足上述定理的條件下,當人數較多時,即n較大時,ΣX就近似的服從正態分布。所以無論每個人的學習情況怎麼樣,總體是近似正太分布的。
正態分布在數理統計中具有基礎性的作用,因此產生高質量的正態分布有重要的意義。我們將介紹幾種數值方法求正態分布:中心極限定理,Hasiting 有理逼近法,統計工具箱,反函數法,舍選法,R軟體及一維正態隨機數的檢驗。
正態分布;一維;隨機數。
一.利用中心極限定理
中心極限定理:(一般 n≥10),
產生服從N(μ,σ)的演算法步驟:
(1)產生n 個RND 隨機數:r1,r2,…,rn;
計算x?(?ri?(2) 2)/
i?1n122;
2(3) 計算 y=σx+μ ,y 是服從 N(μ,σ) 分布的隨機數。
原理分析:
設ζ1,ζ2,…,ζn是n個相互獨立的隨機變數,且ζi~U(0,1), i= 1,2, …,n, 有E(?i)?1
,D(?i)?1,12
n??(??i?n由中心極限定理知 :)/,漸近服從正態分布N(0, l )。
i?1n
注意:我們現在已經能產生[0,1]均勻分布的隨機數了,那麼我們可以利用這個定理來產生標准正態分布的隨機數。
r 1,r2,?,rn現在我們產生n個[0,1]均勻分布隨機數,
我們有: ?1n1?u?n?r??n?i2???i?1?
為方便起見,我們特別選 n = 12,則 : u??ri?6
i?112
這樣我們很方便地就把標准正態分布隨機數計算出來了。
在C語言中表示為:
例1:利用中心極限定理產生標准正態分布隨機數並檢驗
% example 1
clc,clear
for i=1:1000
R=rand(1,12);
X(i)=sum(R)-6;
end
X=X';
m=mean(X)
v=var(X)
subplot(1,2,1),cdfplot(X)
subplot(1,2,2),histfit(X)
h=kstest(X, [X normcdf(X, 0,1)])
結果為:H=0, 接受原假設,變換後的確為標准正態分布。
二.Hasiting 有理逼近法
這是一種計算速度快,也能滿足一定精度的演算法。我們可以構造分布函數反函數的近似逼近公式,來產生標准正態分布的隨機數。其計算公式為:
2a?ay?ay012 x?y?1?b1y?b2y2?b3y3
y?(?2lnr)1/2,r~U(0,1),系數為: 這里
a0 = 2.515517 b1 = 1.432788
a1 = 0.802853 b2 = 0.189269
a2 = 0.010328 b3 = 0.001308
三.利用統計工具箱
在MATLAB統計工具箱中為我們提供了大量的產生各種隨機數發生器程序,我們只需要調用就可以產生我們想要的隨機數。
四.反函數法
設連續型隨機變數Y的概率函數為 f(x), 需產生給定分布的隨機數.
演算法:
(1)產生n個RND 隨機數r1,r2,…,rn;
從等式ri??f(y)dy中解出yi;所得(2) ??yiyi, i=1,2, …,n 即所求.
基本原理:
設隨機變數Y的分布函數F(y)是連續函數,而且隨機變數X~U(0,1),令Z=F(X)。 則Z與Y有相同分布。
證明 :FZ(z)= P{F(X) ≤ z}= P{X≤F(z)}=G(F(z)) = F(z)
因G(x)是隨機變數X 的分布函數:
?0,?G(x)??x,
?1, ?-1-1 x?0;0?x?1;1?x.
-1Y若Y的概率密度為 f(y),由Y=F(X)可得: X?F(Y)??f(y)dy??
對給出定的(0, 1)上均勻分布隨機數ri,則具有給定分布的隨機數 yi 可由方程
if(y)dy解出。 ri????y
五.舍選法
基本思想:
實質上是從許多RND隨機數中選出一部分, 使之成為具有給定分布的隨機數。 設隨機變數X的概率密度函數為f(x),存在實數a<b,使P{a<X<b}=1。 演算法步驟:
(1) 選取常數λ,使λf(x)<1,x∈(a, b);
(2) 產生兩個RND 隨機數r1 、r2,令y= a+(b-a)r1 ;
(3) 若r2≤λf(y),則令x=y;否則剔除 r1和r2, 重返步驟(2),重復循環, 產生的隨機數x1,x2,…,xN的分布由概率函數 f(x) 確定。
舍選法演算法原理分析:
設P{a<Z<b}=1,Z的概率密度為f(z),
(1)選常數λ,使λf(z)≤1,z∈(a,b);
(2)隨機變數X1,X2相互獨立Xi~U(0, 1),令Y1=a+(b-a)X1~U(a, b);
(3)若X2≤λf(Y1),則令X = Y1,否則剔除X1,X2重復到(2); 則隨機變數X的分布與Z相同。
b註: 若不滿足條件:?f(x)dx?1,a
可選取有限區間(a1, b1),使得 ?a1f(x)dx?1??(ε是很小的正數) 例如,取 a1=μ-3σ,b1=μ+3σ(x??)2?e2dx?1?0.003,有a12??b1?b1
在區間(a1, b1)上應用舍選法,不會出現較大的系統誤差。
六.R軟體
利用R軟體,可方便地求各種常見概率分布的分布函數,分位點及生成各種常見分布的隨機數等。在各種分布名稱中加上不同的前綴表示不同的意義如:p-求分布函數,q-求分位點,r產生隨機數等。
七、一維正態隨機數的檢驗
我們已經基本搞清偽隨機數的產生原理,由於並不是真正的隨機數,很自然的問題是,它們是否具有真正隨機數的那些統計性質如參數大小、獨立性,均勻性等等。
設:隨機數具有連續的分布函數F(X),則隨機變數R=(X)是均勻分布(0,1)的隨機變數,因此如果R通過統計檢驗隨機變數 X 也可以通過。因此我們以下著重討論均勻分布R的檢驗問題,再簡單地討論正態隨機數檢驗問題。 統計推斷原理:
X1,X2,?,Xn為 隨機變數序列,則隨機序列的函數稱為統計量。統計量的定義:設
記為:
S?S(X1,X2,?,Xn)顯然統計量 S 也是隨機變數。既然是隨機變數,它們就應該有其分布或稱總體的規律,當然也有各種數字特徵。例如均值、標准差、方差等等各階矩。
我們的統計推斷方式是:
(1)H0:某假定成立;
(2)在假定成立的條件下構造統計量S;
(3)統計量構造完畢,我們也就知道了該統計量的全部統計規律。如它的分布函數,或密度函數各階矩等;
(4)根據統計量的分布,在給定的顯著性水平α,對統計量S 的一次抽樣確定以 1-α為概率的區域,該區域稱為接受域 。如果該次抽樣計算出統計量 S 的值 s 落入該領域,我們就接受原假,否則推翻原假設。這個就是小概率事件在一次實驗實際不可能發生原理。落入由α 確定的區域是一個小概率事件,在一次實驗中我們認為是不可能發生的。
統計檢驗中兩類常用統計量的構造檢驗方法:
?,和有限方差D(X)= ?2,我們抽 N 1.設隨機變數 X 具有數學期望E(X)=
?XN
i??