第五节显著性检验与显著性水准

作者：徐荣祥出版社：中国科学技术出版社发行日期：2009年7月

一、显著性检验（significance test）
显著性检验又称假设检验（hypothesis testing）。假设检验是统计学推断的另一个领域，其应用非常广泛。医学研究中经常比较两组或各组数据均数(或百分率)的差别在统计学上是否有显著意义。这种检验方法称“显著性检验”。由于客观上存在着生物学差异及抽样差异，所以在比较两组均数(或百分率)时就不能只看到两组数值上的差别，而要分析这种差别是否基本上超过了生物差异及抽样差异的范围，是否反映两组（或多组）总体均数存在着差别。检验的目的是计算由于偶然因素的机遇影响，出现这种差别的可能性有多大。
假设有两种：一种是检验假设（也称无效假设），符号为H0；一种是备选假设，符号为H1。H1和H0是相联系的、对立的假设。例如，为了检验两个总体均数是否相等，通常认为，H0为两个总体均数相等（μ1= μ2），即两组处理效果无差别；H1为两个总体均数不相等（μ1≠μ2），即两组处理效果有差别。
按照统计学的步骤，应先做出“无效假设”，即假设两组资料实际上来自同一总体，目前的差别只不过是抽样误差所引起的。然后根据两组样本的实测数据和例数（样本数），计算出上述“无效假设”的可能性有多大？如果这种可能性小于5%(或l%)，就可以认为两组数据来自同一总体的可能性很小，可以否定“无效假设”，而承认两组均数的差异在统计学上有显著(或非常显著)统计学意义。统计学上认为，由抽样误差引起的差异是非本质性的，是没有意义的；由于实验因素引起的差异才是本质性的，才是有意义的。统计学把前者称为“不显著”，把后者称“显著”。
现举例说明，无效假设就是实验前先假设给予的条件（如药物、治疗方法等）不起作用，即实验组给甲药治疗与对照组给乙药治疗的疗效一样，样本来自同一个总体。最后将实验结果进行统计学处理，如两组实验结果无差别，即接受无效假设，两组的差异是抽样造成的；如两组实验结果有差别，即拒绝无效假设，接受备选假设，认为两组数值之差代表着几个规律不相同的总体（一个为给予条件的总体，一个为对照的总体）。这就是统计学处理的依据。
二、显著性水准
根据医学统计学的统传规定：P=001及P=005为“显著性水准”，并作为判断显著意义的标准。P值也可通俗地理解为“批(P)驳两组差别有统计意义的可能性”。
P≤001，批(P)驳的可能性小于或等于1%，即承认两组间差别有统计意义的可能性大于或等于99%。此时可作统计结论认为：“两组间差别有非常显著的意义”。
P≤005(即001＜P≤005)，批(P)驳的可能性小于或等于5%，说明有95%以上的概率可认为两组不是来自同一总体，结论为：两组间差别有显著意义。
P＞005，批(p)驳的可能性大于5%，说明两组均数尽管不同，但该差别来自抽样误差的概率大于5%，结论为：两组间差异无显著意义。
两组间差异不显著说明两数值之差可能都是由抽样误差引起的；差异显著说明两数值之差可由抽样引起的可能性等于或小于5%，两组之差很可能代表了两个规律不同的总体；差异非常显著说明两数值来自一个总体的可能性等于或小于1%，更有可能来自同一总体。
三、统计结论与专业结论
“有显著意义”是个统计结论，表示统计推断(否定无效假设)的可靠程度，说明两组总体很可能不同，但不能说明差别的大小，更不能说明差别之间有任何因果关系。“无显著意义”是说明根据现有数据尚不足于否定无效假设，并不是说没有差异，更不能说两组基本相同。
在作专业结论时除了考虑统计结论外，还要结合专业知识全面考虑，不能做出脱离实际或脱离本题的结论。例如，两组尿量每日只差100mL，或血压只差0667kPa（5mmHg），这时即使统计结果差别有显著意义。实际上，这点细微差别并非有临床价值，不应做出有利尿作用或降压作用的专业结论。再如，甲组创面的愈合时间为125±27天，乙组创面的愈合时间为132±30天，看起来甲组的愈合时间似乎比乙组提前了接近一天，即使有显著意义但无临床意义，因为创面的愈合是以昼夜整天为单位计算的。

第五节 显著性检验与显著性水准

第五节显著性检验与显著性水准