樣本容量的確定
樣本容量的確定 分類:Statistics
在參數區間估計的討論中,估計值和總體的參數之間存在著一定的差異,這種差異是由樣本的隨機性產生的。在樣本容量不變的情況下,若要增加估計的可靠度,置信區間就會擴大,估計的精度就降低了。若要在不降低可靠性的前提下,增加估計的精確度,就只有擴大樣本容量。當然,增大樣本容量要受到人力、物力和時間等條件的限制,所以需要在滿足一定精確度的條件下,盡可能恰當地確定樣本容量。 一、影響樣本容量的因素
(一)總體的變異程度(總體方差)
在其它條件相同的情況下,有較大方差的總體,樣本的容量應該大一些,反之則應該小一些。例如:在正態總體均值的估計中,抽樣平均誤差為它反映了樣本均值相對于總體均值的離散程度。所以,當總體方差較大時,樣本的容量也相應要大,這樣才會使較
(二)允許誤差的大小
允許誤差指允許的抽樣誤差,記為
允許誤差可以表示為
能范圍,所以又稱為誤差。 ,例如,樣本均值與總體均值之間的小,以保證估計的精確度。 ,允許誤差以絕對值的形式表現了抽樣誤差的可
允許誤差說明了估計的精度,所以,在其他條件不變的情況下,如果要求估計的精度高,允許誤差就小,那么樣本容量就要大一些;如要求的精確度不高,允許誤差可以大些,則樣本容量可以小一些。
(三)概率保證度1-α的大小
概率保證度說明了估計的可靠程度。所以,在其他條件不變的情況下,如果要求較高的可靠度,就要增大樣本容量;反之,可以相應減少樣本容量。
(四)抽樣方法不同
在相同的條件下,重復抽樣的抽樣平均誤差比不重復抽樣的抽樣平均誤差大,所需要的樣本容量也就不同。重復抽樣需要更大的`樣本容量,而不重復抽樣的樣本容量則可小一些。
此外,必要的抽樣數目還要受抽樣組織方式的影響,這也是因為不同的抽樣組織方式有不同的抽樣平均誤差。
二、樣本容量的確定
(一) 估計總體均值的樣本容量
在總體均值的區間估計里,置信區間是由下式確定的:
例如,對于正態總體以及非正態總體大樣本時,都是以它為置信區間。
從圖6–1中可以看到,從估計量x的取值到點的距離實際上為置信區間長度的。這段距離表示在一定置信水平1-α下,用樣本均值估計總體均值時所允許的最大絕對誤差即允許誤差Δ。顯然,若以x的取值為原點,則允許誤差Δ可以表示為:
(6–15)
x=0
圖6–1 允許誤差示意圖
公式(6–15)反映了允許誤差Δ、可靠性系數、總體標準差與樣本容量之間的相互制約關系。只要這四個因素中的任意三個因素確定后,另一個因素也就確定了。
在重復抽樣條件下,把允許誤差Δ的計算公式
容量的計算公式: 變形整理,則得到樣本
(6–16)
在不重復抽樣的條件下,抽樣允許誤差為
形后得到不重復抽樣條件下的樣本容量公式為 , 因此變
n=(6–17)
例6–14 某食品廠要檢驗本月生產的10 000袋某產品的第一文庫網重量,根據以往的資料,這種產品每袋重量的標準差為25克。如果要求在95.45%的置信度下,平均每袋重量的誤差不超過5克,應抽查多少袋產品?
解由題意可知N=10 000(原作者誤為20 000),
1–α=95.45%,有=2。在重復抽樣的條件下 =25克,=5克,根據置信度
n=(袋)
注:Excel中的計算方法:
利用標準正態分布函數的反函數NORMSINV計算在該置信度下的標準偏差度z=2; 題中要求平均每袋重量的誤差不超過5,即表明SD*z小于或者等于5;
那么倒推標準偏差應該不超過2.5;在總體標準差為25克的前提下,那么取樣量應該為99.96,當然,取樣量應該是整數,即100。
在不重復抽樣條件下
n==99(袋)
由計算結果可知:在其它條件相同的情況下,重復抽樣所需要的樣本容量大于不重復抽樣所需要的樣本容量。
在計算樣本容量時,必須知道總體的方差,而在實際抽樣調查前,往往總體的方差是未知的。在實際操作時,可以用過去的資料,若過去曾有若干個方差,應該選擇最大的,以保證抽樣估計的精確度;也可以進行一次小規模的調查,用調查所得的樣本方差來替代總體的方差。
(二)估計總體成數時的樣本容量
估計總體成數時樣本容量的確定方法與估計總體均值是一樣的,設
允許誤差,在1—a的置信度下,重復抽樣條件下有 為
解上面的方程可得重復抽樣條件下樣本容量的公式為
同理可得不重復抽樣條件下的樣本容量公式為
(6–19)
在估計成數時,計算樣本容量時需要總體的成數,但是總體的成數通常是未知的,在實際的抽樣調查時,可先進行小規模的試調查求得樣本的成數來代替。也可用歷史的資料,如果有若干個成數可供選擇,則應選擇最靠近50%的成數,使樣本成數的方差最大,以保證估計的精確度。
例6–15 為了檢查某企業生產的10 000個顯像管的合格率,需要確定樣本的容量。根據以往經驗合格率為90%、91.7%。如果要求估計的允許誤差不超過0.0275,置信水平為95.45%。求應該取多少只顯像管?
解根據資料,我們應該選擇P=0.9計算樣本容量,根據置信水平0.9545,有
重復抽樣條件下,樣本容量
=2,
不重復抽樣條件樣本容量
從計算的結果可以看出,重復抽樣應該抽477件件檢驗,而不重復抽樣應該抽455件,可見,在相同條件下,重復抽樣需要的樣本容量更大。
注:Excel中的計算方法:
利用標準正態分布函數的反函數NORMSINV計算在該置信度下的標準偏差度z=2.
【樣本容量的確定】相關文章:
樣本容量對Poisson控制圖的影響11-23
確定05-18
確定位置01-21
不確定的意思是什么不確定造句示例03-31
勞動賠償怎么確定02-09
面試如何確定勝勢01-01
CPA檢查標尺確定08-02
確定方向 努力向前07-13