统计学概念

2023-04-17 02:26:19 文档大全网 [ 字体：小中大 ] [ 阅读： ]

【#文档大全网# 导语】以下是®文档大全网的小编为您整理的《统计学概念》，欢迎阅读！
统计学,概念
Z 总体：同质的个体所构成的全体。（根据研究目的确定的同质的全部研究对象）

C 抽样误差：此样本的数据构成的统计指标（如均数）就会与总体的该统计指标有误，这种差异是由抽样引起的，故这种误差叫做抽样误差。

Y 样本：是从总体中按一定程序（随机）抽出的部分观察单位组成的集合。

X 小概率事件：习惯将P≤0.05或P≤0.01的事件称为小概率事件，表示该事件发生的可能性小。

B 标准误：抽样研究时，由于个体存在差异，因此通过样本推论总体时会存在一定的误差，如样本均数X往往不等于总体均数μ，这种由抽样造成的样本均数与总体均数的差异称为抽样误差。

J 假设检验中Ⅰ型错误：拒绝了实际上成立的Ho，即“弃真”的错误。 J 假设检验中Ⅱ型错误：接受了实际上不成立的Ho，即“存伪”的错误。 F 非参数检验：可以不考虑总体的参数和总体的分布类型，而对总体的分布或分布位置进行检验。

X 相关系数：说明具有直线关系的两个变量间相关密切程度和相关方向的统计量。 J 检验效能：（检验功效：即Ho为假时，拒绝Ho的概率，亦称把握度，其意义为当两总体确有有差异，按规定的检验水准能发现该差异的能力。） G 概率：描写某一事件发生的可能性大小的一个量度。

S 四分位数间距：把所有的观察值排序后，分成四个数目相等的段落，每个段落的观察值数目各占总例数的25%，去掉两端的25%，取中间50%观察值的数据范围即为四分位数间距。

X线性相关：用来分析呈现直线型相关的统计方法。

X线性回归：寻求一个直线方程来描述两个变量间依存变化的近似的线性数量关系。

1. 各假设检验方法应用的条件：t检验：1、样本来自正态分布总体；2、两总体方差具有

齐性。非参数检验方法：1、总体分布为偏态或分布形式未知的计量资料（尤其在n<30的情况下）；2、等级资料；3、个别数据偏大或数据的某一端无确定的数值，只有一个下限或上限，而没有具体数值；4、各组离散程度相差悬殊，即各总体方差不齐。

2. t检验中的注意事项：1，要有严密的抽样设计2.选用的检验方法必须符合其使用条件3.

单侧检验和双侧检验（需根据研究目的和专业知识选择适当方法）4.假设检验的结论不能绝对化5.正确理解P值与差别无统计意义6.假设检验与可信区间的关系（既密切又有区别，根据研究目的加以选择）。

3. 假设检验中的两类错误：Ⅰ型错误（假阳性错误）是指拒绝了实际上存在的H0,即“弃

真”的错误。在H0成立的情况下，由于抽样的偶然性，得到了较大的t值，若t>t0.05(ν),则按α=0.05水准拒绝H0，犯了Ⅰ型错误。Ⅰ型错误的概率用α表示，研究者可根据不同研究目的来确定α水平。如规定α=0.05，当拒绝H0时，理论上100次检验中平均有5次发生此类错误。α表示检验有意义的水准，故亦称检验水准。

Ⅱ型错误（假阴性错误）是指接受了实际不成立的H0，即“存伪”的错误。实际上H0不成立，H1成立，由于抽样的偶然性得到了不同的t值，得tν),则按α=0.05的水准，不拒绝H0.这就犯了Ⅱ型错误，其概率用β表示。

4. 相对数使用应注意的问题:1.不要把构成比与率相混淆2.使用相对数时，分母不宜过小3.

要注意资料的可比性4.要注意使用率的标准化5.要考虑存在抽样误差。

5. 假设检验的步骤：1、假设；2、确定检验水准；3、计算统计量；4、确定概率值；5、

做出推论。

6. 参数检验和非参数检验的优缺点;参数检验优点：对资料的分析利用充分，统计分析效率

高；缺点：对资料要求高，适用范围有限。非参数检验优点：适用范围广，受限条件少，稳健性较好；缺点：对信息利用不充分，检验效率低（易范Ⅱ型错误）

7. 线性相关的步骤：1、绘制散点图；2、计算线性相关系数；3、线性相关系数的假设检

验。

8. 均数的应用;主要适用于对称分布或偏斜度不大的资料，尤其适合正态分布资料。 9. 几何均数应用：明显呈正态分布的资料经过对数变换后呈对数分布。 10. 百分位数应用：在频数分布呈明显偏态（观察值间相差比较大）、或频数分布的两端无

确定数值时。

11. 中位数计算：将一组观察值从小到大按顺序排列，据中心位置的数值即为中位数，记为

M。当观察例数n为奇数时，中位数是按顺序排列在第（n+1）/2项的观察值；当观察例数为偶数时，则中位数是按顺序排列在第n/2项和第（n/2）+1项之间，即该两项的平均值。

12. 百分位数的计算：百分位数用符号Px表示，x即百分位，所谓百分位数Px是指在一组

数据中找到这样一个值，全部观察值的x%小于Px，而其余（100—x）%大于Px。公式：Px=L+[(n·x%—fL)/fx]ix，式中L、ix、fx分别为Px所在组段的下限、组距和频数，fL为Px所在组段之前各组段的累积频数。

13. 四分位数间距计算：把所有的观察值排序后，分成四个数目相等的段落，每个段落的观

察值数目各占总例数的25%，去掉两端的25%，取中间50%观察值的数据范围即为四分位数间距。四分位数间距用符号Q表示，它可以通过计算百分位数P25和P75之差得到，即Q=P75—P25。四分位数间距越大，说明数据的变异越大；反之四分位数间距越小说明变异越小。 14. 均数的计算：（1）算术均数①直接法 ¯X=(X1+X2+…Xn)/n=∑x/n,¯X表示样本均数，∑

为求和符号，n为样本观察例数；②加权法 ¯X=( f1x1+f2x2+…+fkxk)/n=∑fx/n,k表示频数表的组段数，f1、f2、…、fk及x1、 x2、…、xk表示至k组的频数及组中值，组中值=（本组段下限+本组段上限）/2；（2）几何均数①G= 15. 标准差的计算：SD=

16. 总体均数可信区间的计算：①σ未知

②σ已知或σ未知，但n足够大：若σ已知

17.医学参考值范围的估计:参考值范围所对应的正态分布区间百分范围 95 99

单侧下限￣X—1.65S ￣X—2.33S

单侧上限￣X +1.65S ￣X+2.33S

双侧（对称）下限￣X—1.96S ￣X—2.58S

双侧（对称）上限￣X +1.96S ￣X+2.58S

18.单个样本的t检验:

1，建立检验假设，确定检验水准 Ho:µ=µo H1：µ≠µo α=0.05

2，计算检验统计量

在µ=µo成立的前提条件下计算统计量为： 3，确定P值，做出推断结论自由度公式： =n—1

本例自由度： =n—1 =30—1=29 查附表2，得