2.3 Minitab随机抽样
实例:如何使用Minitab从10000名顾客中,随机抽取100名顾客(每名顾客都有一个固定且不重复的客户编号1~10000)
1>点击minitab中“计算”,从下拉菜单中选择“随机数据”,再选择子菜单“来自列的样本”
2> 点击“来自列的样本”, 在对话框中选择相关内容,“取样行号”框内输入目标随机取样的样本数量;“来自列”框内选择左边的C1列“Customer ID”,“将样本存储在”框内手工输入存储列名称“Samples”,点击确定按钮。
3> 在C2列“Samples”下存储从C1列 “Customer ID”中随机抽取的100个样本数据;
2.2 采样分布
采样分布是给定统计量(例如均值)的概率分布 。例如,下表显示了整个总体(6 个南瓜)的重量。这些南瓜的重量只能是下表中列出的重量值之一。
虽然整个总体是已知的,但是为了便于说明,我们从总体中取包含 3 个南瓜的所有可能随机样本(20 个随机样本)。然后,计算各样本的均值。样本均值的取样分布由每个可能随机样本(包含 3 个南瓜)的所有样本均值描述,其显示在下表中。
此图显示了平均重量值的采样分布。此分布围绕 15.5(这也是总体均值 的真值)。其样本均值较接近 15.5 的随机样本的发生概率,比其样本均值较远离 15.5 的随机样本的发生概率更高。
在实际中,生成以上所示的采样分布表是不可行的。即使在最佳情况下(即知道样本的父级总体),可能仍无法确定所需样本统计量的精确采样分布。但是,在某些情况下,可能能够大致地确定样本量统计的采样分布。例如,如果从正态总体中取样,则样本平均值具有完全的正态分布。
但是,如果从一个非正态分布 中抽样,则可能无法确定样本均值的准确分布。但是,由于中心极限定理,样本均值近似地呈正态分布,前提是您的样本足够大。然后,如果总体未知并且样本足够大,则您也许能够做出判断(例如,85% 地判断样本均值在一定数量的总体均值的标准差 之内。
中心极限定理:随着样本量的无限增长,无论原来的分布是什么(离散分布 或连续分布,正态分布或非正态分布), \bar{x} 的分布总会趋向于正态分布。
注意:实际工作中,只要n较大时,我们就可以认为, \bar{x} 的分布近似于正态分布 。当分布对称时,n=5已经近似得很好;当分布严重偏斜时,n=30也会近似得很好。
武汉格发信息技术有限公司,格发许可优化管理系统可以帮你评估贵公司软件许可的真实需求,再低成本合规性管理软件许可,帮助贵司提高软件投资回报率,为软件采购、使用提供科学决策依据。支持的软件有: CAD,CAE,PDM,PLM,Catia,Ugnx, AutoCAD, Pro/E, Solidworks ,Hyperworks, Protel,CAXA,OpenWorks LandMark,MATLAB,Enovia,Winchill,TeamCenter,MathCAD,Ansys, Abaqus,ls-dyna, Fluent, MSC,Bentley,License,UG,ug,catia,Dassault Systèmes,AutoDesk,Altair,autocad,PTC,SolidWorks,Ansys,Siemens PLM Software,Paradigm,Mathworks,Borland,AVEVA,ESRI,hP,Solibri,Progman,Leica,Cadence,IBM,SIMULIA,Citrix,Sybase,Schlumberger,MSC Products...