總體和樣本

一、點估計量

在某些情況下,我們並不知道總體參數的確切數值,只能通過樣本估計總體參數。

點估計量就是通過樣本對於總體參數的最佳猜測值

例如:總體均值    總體均值點估計量 

 

二、估計總體均值(樣本估計總體)

在已知情況下,樣本均值是我們能為總體均值做出的最好估計-樣本均值是最有可能被作為總體均值的數值。

樣本均值可作為總體均值的點估計量,記為: = (樣本均值)。

 

三、估計總體方差(樣本估計總體)

由於樣本比較與總體,數值數量變少,因此,與總體中數值偏離於均值的程度相比,樣本中的數值更有可能更加密集在均值周圍。

所以,樣本數據的方差不是總體方差的最好估計方法,如果用樣本方差估計總體方差,估計結果會稍微偏低。

通常,如果樣本大小為n,可以用下面算式估計總體方差:

   當需要估計總體方差時,樣本數減-1

 

四、估計總體比例(樣本估計總體)

如果用代表樣本樣本比例,則可以用下式估計總體比例:

 , 代表總體比例的點估計量。

 

五、比例的抽樣分布(總體估計樣本)

總體比例p已知時,需要考慮大小為n的樣本,得出所有樣本比例的分布,該分布稱作為「比例的抽樣分布」或者「的分布」。

推導:

條件:總體糖球樣本中紅色糖球比例為p,樣本大小為n。

隨機變數X代表樣本中紅色糖球的數目,X~B(n,p)。紅色糖球比例取決於X,即比例可作為另一隨機變數X/n記作為

期望:E() = E(X/n) = E(X)/n, X服從二項分布即E(X)=np,於是E()=p。

結果符合預期,我們期望樣本中比例與總體比例相一致。

方差:Var() = Var(X/n)=Var(X)/n2=npq/n2=pq/n。

分布:當n越大時,的分布越接近正態分布,通常認為n>30時,符合正態分布,此時 ~ N(p, pq/n)。

應用:可通過的分布計算樣本比例至少為某值的概率。

連續性修正:在利用正態分布計算概率時,需要進行連續性修正提高正確率,修正值為 +-1/2n。

比例的抽樣分布用處:求出已知總體中取出某個樣本比例的概率

 

六、均值的抽樣分布(總體估計樣本)

當已知總體均值和方差,需要考慮大小為n的樣本,得出所有樣本均值形成的分布,叫做「均值的抽樣分布」,或者的分布。

推導:已知袋裝糖球總體,均值和方差,一個包裝袋糖球數量用X 表示,每一袋糖球都符合相同分布,用Xi代表隨機選擇一袋糖球中的糖球數量,均值和方差

取n包糖球作為樣本,X1到Xn表示包裝袋中糖球數量,表示n袋糖球的容量均值。

期望:E() = E(X1+X2+…+Xn/n) = 1/n(E(X1)+E(X2)+..+E(Xn)) = 1/n(n) = 

結果樣本量為n的均值符合總體均值。

方差:Var() = Var(X1+X2+…+Xn/n) = 1/n2(n) = /n

分布

  • X符合正態正態分布X~N(,) 則符合正態分布~N(,/n)
  • n很大時,可以用正態分布近似~N(,/n)(中心極限定理:如果從一個非正態總體X中取出一個樣本,且樣本很大>30,則的分布近似為正態分布)

應用:均值的抽樣分布為我們提供了一種計算樣本均值的概率的方法。

 

2020-0509-21:40