總體和樣本
一、點估計量
在某些情況下,我們並不知道總體參數的確切數值,只能通過樣本估計總體參數。
點估計量就是通過樣本對於總體參數的最佳猜測值。
例如:總體均值 總體均值點估計量
二、估計總體均值(樣本估計總體)
在已知情況下,樣本均值是我們能為總體均值做出的最好估計-樣本均值是最有可能被作為總體均值的數值。
樣本均值可作為總體均值的點估計量,記為: =
(樣本均值)。
三、估計總體方差(樣本估計總體)
由於樣本比較與總體,數值數量變少,因此,與總體中數值偏離於均值的程度相比,樣本中的數值更有可能更加密集在均值周圍。
所以,樣本數據的方差不是總體方差的最好估計方法,如果用樣本方差估計總體方差,估計結果會稍微偏低。
通常,如果樣本大小為n,可以用下面算式估計總體方差:
當需要估計總體方差時,樣本數減-1。
四、估計總體比例(樣本估計總體)
如果用代表樣本樣本比例,則可以用下式估計總體比例:
,
代表總體比例的點估計量。
五、比例的抽樣分布(總體估計樣本)
當總體比例p已知時,需要考慮大小為n的樣本,得出所有樣本比例的分布,該分布稱作為「比例的抽樣分布」或者「的分布」。
推導:
條件:總體糖球樣本中紅色糖球比例為p,樣本大小為n。
隨機變數X代表樣本中紅色糖球的數目,X~B(n,p)。紅色糖球比例取決於X,即比例可作為另一隨機變數X/n記作為,
期望:E(
) = E(X/n) = E(X)/n, X服從二項分布即E(X)=np,於是E(
)=p。
結果符合預期,我們期望樣本中比例與總體比例相一致。
方差:Var(
) = Var(X/n)=Var(X)/n2=npq/n2=pq/n。
的分布:當n越大時,
的分布越接近正態分布,通常認為n>30時,
符合正態分布,此時
~ N(p, pq/n)。
應用:可通過的分布計算樣本比例至少為某值的概率。
連續性修正:在利用正態分布計算概率時,需要進行連續性修正提高正確率,修正值為 +-1/2n。
比例的抽樣分布用處:求出已知總體中取出某個樣本比例的概率。
六、均值的抽樣分布(總體估計樣本)
當已知總體均值和方差
,需要考慮大小為n的樣本,得出所有樣本均值形成的分布,叫做「均值的抽樣分布」,或者
的分布。
推導:已知袋裝糖球總體,均值和方差
,一個包裝袋糖球數量用X 表示,每一袋糖球都符合相同分布,用Xi代表隨機選擇一袋糖球中的糖球數量,均值
和方差
,
取n包糖球作為樣本,X1到Xn表示包裝袋中糖球數量,表示n袋糖球的容量均值。
的期望:E(
) = E(X1+X2+…+Xn/n) = 1/n(E(X1)+E(X2)+..+E(Xn)) = 1/n(n
) =
結果樣本量為n的均值符合總體均值。
的方差:Var(
) = Var(X1+X2+…+Xn/n) = 1/n2(n
) =
/n
的分布
- 若X符合正態正態分布X~N(
,
) 則
符合正態分布
~N(
,
/n)
- 若n很大時,
可以用正態分布近似
~N(
,
/n)(中心極限定理:如果從一個非正態總體X中取出一個樣本,且樣本很大>30,則
的分布近似為正態分布)
應用:均值的抽樣分布為我們提供了一種計算樣本均值的概率的方法。
2020-0509-21:40