第五节 显著性检验与显著性水准

作者:徐荣祥 出版社:中国科学技术出版社 发行日期:2009年7月
一、显著性检验(significance test)
显著性检验又称假设检验(hypothesis testing)。假设检验是统计学推断的另一个领域,其应用非常广泛。医学研究中经常比较两组或各组数据均数(或百分率)的差别在统计学上是否有显著意义。这种检验方法称“显著性检验”。由于客观上存在着生物学差异及抽样差异,所以在比较两组均数(或百分率)时就不能只看到两组数值上的差别,而要分析这种差别是否基本上超过了生物差异及抽样差异的范围,是否反映两组(或多组)总体均数存在着差别。检验的目的是计算由于偶然因素的机遇影响,出现这种差别的可能性有多大。
假设有两种:一种是检验假设(也称无效假设),符号为H0;一种是备选假设,符号为H1。H1和H0是相联系的、对立的假设。例如,为了检验两个总体均数是否相等,通常认为,H0为两个总体均数相等(μ1= μ2),即两组处理效果无差别;H1为两个总体均数不相等(μ1≠μ2),即两组处理效果有差别。
按照统计学的步骤,应先做出“无效假设”,即假设两组资料实际上来自同一总体,目前的差别只不过是抽样误差所引起的。然后根据两组样本的实测数据和例数(样本数),计算出上述“无效假设”的可能性有多大?如果这种可能性小于5%(或l%),就可以认为两组数据来自同一总体的可能性很小,可以否定“无效假设”,而承认两组均数的差异在统计学上有显著(或非常显著)统计学意义。统计学上认为,由抽样误差引起的差异是非本质性的,是没有意义的;由于实验因素引起的差异才是本质性的,才是有意义的。统计学把前者称为“不显著”,把后者称“显著”。
现举例说明,无效假设就是实验前先假设给予的条件(如药物、治疗方法等)不起作用,即实验组给甲药治疗与对照组给乙药治疗的疗效一样,样本来自同一个总体。最后将实验结果进行统计学处理,如两组实验结果无差别,即接受无效假设,两组的差异是抽样造成的;如两组实验结果有差别,即拒绝无效假设,接受备选假设,认为两组数值之差代表着几个规律不相同的总体(一个为给予条件的总体,一个为对照的总体)。这就是统计学处理的依据。
二、显著性水准
根据医学统计学的统传规定:P=001及P=005为“显著性水准”,并作为判断显著意义的标准。P值也可通俗地理解为“批(P)驳两组差别有统计意义的可能性”。
P≤001,批(P)驳的可能性小于或等于1%,即承认两组间差别有统计意义的可能性大于或等于99%。此时可作统计结论认为:“两组间差别有非常显著的意义”。
P≤005(即001<P≤005),批(P)驳的可能性小于或等于5%,说明有95%以上的概率可认为两组不是来自同一总体,结论为:两组间差别有显著意义。
P>005,批(p)驳的可能性大于5%,说明两组均数尽管不同,但该差别来自抽样误差的概率大于5%,结论为:两组间差异无显著意义。
两组间差异不显著说明两数值之差可能都是由抽样误差引起的;差异显著说明两数值之差可由抽样引起的可能性等于或小于5%,两组之差很可能代表了两个规律不同的总体;差异非常显著说明两数值来自一个总体的可能性等于或小于1%,更有可能来自同一总体。
三、统计结论与专业结论
“有显著意义”是个统计结论,表示统计推断(否定无效假设)的可靠程度,说明两组总体很可能不同,但不能说明差别的大小,更不能说明差别之间有任何因果关系。“无显著意义”是说明根据现有数据尚不足于否定无效假设,并不是说没有差异,更不能说两组基本相同。
在作专业结论时除了考虑统计结论外,还要结合专业知识全面考虑,不能做出脱离实际或脱离本题的结论。例如,两组尿量每日只差100mL,或血压只差0667kPa(5mmHg),这时即使统计结果差别有显著意义。实际上,这点细微差别并非有临床价值,不应做出有利尿作用或降压作用的专业结论。再如,甲组创面的愈合时间为125±27天,乙组创面的愈合时间为132±30天,看起来甲组的愈合时间似乎比乙组提前了接近一天,即使有显著意义但无临床意义,因为创面的愈合是以昼夜整天为单位计算的。