您当前位置：首页 > 作者园地

统计学方法的正确抉择

发布时间:16/3/8 来源:本站阅读 2640 次

统计学方法的正确抉择

一．统计方法抉择的条件

在临床科研工作中，正确地抉择统计分析方法，应充分考虑科研工作者的分析目的、临床科研设计方法、搜集到的数据资料类型、数据资料的分布特征与所涉及的数理统计条件等。其中任何一个问题没考虑到或考虑有误，都有可能导致统计分析方法的抉择失误。

此外，统计分析方法的抉择应在科研的设计阶段来完成，而不应该在临床试验结束或在数据的收集工作已完成之后。

对临床科研数据进行统计分析和进行统计方法抉择时，应考虑下列因素：

1．分析目的

对于临床医生及临床流行病医生来说，在进行统计分析前，一定要明确利用统计方法达到研究者的什么目的。一般来说，统计方法可分为描述与推断两类方法。一是统计描述(descriptive statistics)，二是统计推断(inferential statistics)。

统计描述，即利用统计指标、统计图或统计表，对数据资料所进行的最基本的统计分析，使其能反映数据资料的基本特征，有利于研究者能准确、全面地了解数据资料所包涵的信息，以便做出科学的推断。统计表，如频数表、四格表、列联表等；统计图，如直方图、饼图，散点图等；统计指标，如均数、标准差、率及构成比等。

统计推断，即利用样本所提供的信息对总体进行推断（估计或比较），其中包括参数估计和假设检验，如可信区间、t检验、方差分析、c2检验等，如要分析甲药治疗与乙药治疗两组的疗效是否不相同、不同地区某病的患病率有无差异等。

还有些统计方法，既包含了统计描述也包含了统计推断的内容，如不同变量间的关系分析。相关分析，可用于研究某些因素间的相互联系，以相关系数来衡量各因素间相关的密切程度和方向，如高血脂与冠心病、慢性宫颈炎与宫颈癌等的相关分析；回归分析，可用于研究某个因素与另一因素（变量）的依存关系，即以一个变量去推测另一变量，如利用回归分析建立起来的回归方程，可由儿童的年龄推算其体重。

2．资料类型

资料类型的划分现多采用国际通用的分类方法，将其分为两类：数值变量(numerical variable)资料和分类变量(categorical variable)资料。数值变量是指其值是可以定量或准确测量的变量，其表现为数值大小的不同；而分类变量是指其值是无法定量或不能测量的变量，其表现没有数值的大小而只有互不相容的类别或属性。分类变量又可分为无序分类变量和有序分类变量两小类，无序分类变量表现为没有大小之分的属性或类别，如：性别是两类无序分类变量，血型是四类无序分类变量；有序分类变量表现为各属性或类别间有程度之分,如：临床上某种疾病的“轻、中、重”，治疗结果的“无效、显效、好转、治愈”。由此可见，数值变量资料、无序分类变量资料和有序分类变量资料又可叫做计量资料、计数资料和等级资料。

资料类型的划分与统计方法的抉择有关，在多数情况下不同的资料类型，选择的统计方法不一样。如数值变量资料的比较可选用t检验、u检验等统计方法；而率的比较多用c2检验。

值得注意的是，有些临床科研工作者，常常人为地将数值变量的结果转化为分类变量的临床指标，然后参与统计分析，如患者的血红蛋白含量，研究者常用正常、轻度贫血、中度贫血和重度贫血来表示，这样虽然照顾了临床工作的习惯，却损失了资料所提供的信息量。换言之，在多数情况下，数值变量资料提供的信息量最为充分，可进行统计分析的手段也较为丰富、经典和可靠，与之相比，分类变量在这些方面都不如数值变量资料。因此，在临床实验中要尽可能选择量化的指标反映实验效应，若确实无法定量时，才选用分类数据，通常不宜将定量数据转变成分类数据。

3．设计方法

在众多的临床科研设计方法中，每一种设计方法都有与之相适应的统计方法。在统计方法的抉择时，必须根据不同的临床科研设计方法来选择相应的统计分析方法。如果统计方法的抉择与设计方法不一致，统计分析得到的任何结论都是错误的。

在常用的科研设计方法中，有成组设计（完全随机设计）的t检验、配对t检验、成组设计（完全随机设计）的方差分析、配伍设计（随机区组设计）的方差分析等，都是统计方法与科研设计方法有关的佐证。因此，应注意区分成组设计（完全随机设计）与配对和配伍设计（随机区组设计），在成组设计中又要注意区别两组与多组设计。最常见的错误是将配对或配伍设计（随机区组设计）的资料当做成组设计（完全随机设计）来处理，如配对设计的资料使用成组t检验、配伍设计（随机区组设计）使用成组资料的方差分析；或将三组及三组以上的成组设计（完全随机设计）资料的比较采用多个t检验、三个或多个率的比较采用四格表的卡方检验来进行比较，都是典型的错误。如下表：

表1 常见与设计方法有关的统计方法抉择错误

设计方法	错误的统计方法	正确统计方法
两个均数的比较（成组设计、完全随机设计）		成组设计的t检验、成组设计的秩和检验
多个均数的比较（成组设计、完全随机设计）	多个成组设计的t检验	完全随机设计的方差分析及q检验、完全随机设计的秩和检验及两两比较
数值变量的配对设计	成组设计的t检验	配对t检验、配对秩和检验
随机区组设计（配伍设计）	多个成组设计的t检验、完全随机设计的方差分析	随机区组设计的方差分析及q检验、随机区组设计的秩和检验及两两比较
交叉设计	成组设计的t检验、配对t检验、配对秩和检验	交叉设计的方差分析、交叉设计的秩和检验

4．分布特征及数理统计条件

数理统计和概率论是统计的理论基础。每种统计方法都要涉及数理统计公式，而这些数理统计公式都是在一定条件下推导和建立的。也就是说，只有当某个或某些条件满足时，某个数理统计公式才成立，反之若不满足条件时，就不能使用某个数理统计公式。

在数理统计公式推导和建立的条件中，涉及最多的是数据的分布特征。数据的分布特征是指数据的数理统计规律，许多数理统计公式都是在特定的分布下推导和建立的。若实际资料服从（符合）某种分布，即可使用该分布所具有的数理统计规律来分析和处理该实际资料，反之则不能。在临床资料的统计分析过程中，涉及得最多的分布有正态分布、偏态分布、二项分布等。

许多统计方法对资料的分布有要求，如：均数和标准差、t和u检验；方差分析都要求资料服从正态分布，而中位数和四分位数间距、秩和检验等，可用于不服从正态分布的资料。所以，临床资料的统计分析过程中，应考虑资料的分布特征，最起码的要求是熟悉正态分布与偏态分布。

例如：在临床科研中，许多资料的描述不考虑资料的分布特征，而多选择均数与标准差。如某妇科肿瘤化疗前的血象值，资料如下表：

某妇科肿瘤化疗前的血象值

指标名	例数	均数	标准差	偏度系数	P值	峰度系数	P值
血红蛋白(g/L)	98	111.99	18.82	0.180	0.459	0.025	0.958
血小板(×109/L)	98	173.58	87.11	1.353	0.000	1.843	0.000
白细胞(×109/L)	98	6.7930	2.767	1.207	0.000	1.202	0.013

从上结果可见，若只看三项指标的均数和标准差，临床医生也许不会怀疑有什么问题。但是经正态性检验，病人的血红蛋白服从正态分布，而血小板和白细胞两项指标的偏度和峰度系数均不服从正态分布（P<0.05）。因此，描述病人的血小板和白细胞平均水平正确的指标是中位数，而其变异程度应使用四分位数间距。

除了数据的分布特征外，有些数理统计公式还有其它一些的条件，如t检验和方差分析的方差齐性、卡方检验的理论数(T)大小等。

总之，对于临床科研工作者来说，为正确地进行统计方法的抉择，首先要掌握或熟悉上述影响统计方法抉择因素；其次，还应熟悉和了解常用统计方法的应用条件。

二．数据资料的描述

统计描述的内容包括了统计指标、统计图和表，其目的是使数据资料的基本特征更加清晰地表达。本节只讨论统计指标的正确选用，而统计图表的正确使用请参阅其他书籍。

1．数值变量资料的描述

描述数值变量资料的基本特征有两类指标，一是描述集中趋势的指标，用以反映一组数据的平均水平；二是描述离散程度的指标，用以反映一组数据的变异大小。各指标的名称及适用范围等见表2。

表2 描述数值变量资料的常用指标

指标名称	用途	适用的资料
均数（）	描述一组数据的平均水平，集中位置	正态分布或近似正态分布
中位数（M）	与均数相同	偏态分布、分布未知、两端无界
几何均数（G ）	与均数相同	对数正态分布，等比资料
标准差（S）	描述一组数据的变异大小，离散程度	正态分布或近似正态分布
四分位数间距（QU-QL）	与标准差相同	偏态分布、分布未知、两端无界
极差（R）	与标准差相同	观察例数相近的数值变量
变异系数（CV）	与标准差相同	比较几组资料间的变异大小

从表中可看出，均数与标准差联合使用描述正态分布或近似正态分布资料的基本特征；中位数与四分位数间距联合使用描述偏态分布或未知分布资料的基本特征。

这些描述指标应用时，最常见的错误是不考虑其应用条件的随意使用，如：用均数和标准差描述偏态分布、分布未知或两端无界的资料，这是目前在临床研究文献中较为普遍和典型的错误。

2．分类变量资料的描述

描述分类变量资料常用的指标有死亡率、患病率、发病率等。

临床上，这类指标的应用较多，出现的错误也较多。这些错误归纳起来大致有两类：一是以比代率，即误将构成比(proportion)当做率(rate)来描述某病发生的强度和频率，如用某病的病人数除以就诊人数（或人次）得到“某病患病率”或“某病发病率”，就是典型的以比代率的例子。二是把各种不同的率相互混淆，如把患病率与发病率、死亡率与病死率等概念混同。

需要指出的是，单纯利用医院常规资料，最易得到的指标是构成比。而描述疾病发生强度和频率的指标的率反映如患病率、发病率、死亡率等，很难利用医院的常规资料（如医院医院的病例档案）获得。因为，医院常规资料无法得到计算这些率所需的分子和分母的资料。所以，一旦研究者利用的是医院常规资料，则无法衡量疾病对人群的危害程度。常用描述指标如表3。

表3 描述分类变量资料的常用指标

指标名称	计算公式	意义
率	可能发生某现象的观察单位总数(发生某现象的观察单位数)	描述事件发生的强度和频率
构成比	A+B+…(A)	事物内部各组成部分所占的比重
相对比	B ( A )	A指标为B指标的若干倍或百分之几

三．数据资料的比较

在众多的科研研究方法中，归纳起来最基本的手段有两种，一是对研究对象的全体进行研究，在实际工作中往往难以实现；二是从总体中抽取一定数量的样本进行抽样研究，但要考虑抽样误差对结果的影响。因此，若用样本信息去推断其所代表的总体间有无差别时，需要使用假设检验(hypothesis testing)或称显著性检验(significance test)。

1．假设检验的基本步骤

（1）建立检验假设。

建立假设的过程应有三个内容。即无效假设H0 (null hypothesis)、备择假设H1 (alternative hypothesis)和检验水准a (size of test)。无效假设H0是研究者想得到结论的对立事件的假设，对于差异性检验而言，研究者想得到的是“有差别”的结论，故首先应假设各总体间无差别；备择假设H1是其对立的假设，即是“有差别”的假设；此外，还应确定有统计意义的概率水平a，通常a取0.05。建立检验假设的通常格式为：

H0：多个样本来自同一总体，各样本间的差别是由于抽样误差所致

H1：多个样本来自不同的总体，各样本间的差别是由于不同总体所致

a =0.05

（2）计算统计量。

根据资料的类型、分布特征、科研设计方法等条件，选择不同的统计量计算方法，如t检验、u检验等统计方法。

（3）根据统计量的值得到概率(P)值；再按概率(P)值的大小得出结论。其结论只有两种情况，若P≤a时，即概率小于我们事先确定好的检验水平概率（如P≤0.05），我们就拒绝其无差别假设H0，而接受H1，认为差别有统计学意义，各样本来自不同总体，样本间的差别是总体的不同所致；若P＞a时，其概率大于我们事先确定好的检验水平（如P＞0.05），我们就不拒绝其无差别的假设H0，还不能认为各总体间有差别，样本来自同一总体，即差别没有统计学意义。

2．假设检验结论的两类错误

在假设检验的两种结论中无论做出何种结论，都有可能犯错误。

当P≤a时，做出“拒绝其无差别的假设，可认为各总体间有差别”的结论时就有可能犯错误，这类错误称为第一类错误（Ⅰ型错误，type Ⅰ error），其犯错误的概率用a表示，若a取0.05，此时犯Ⅰ型错误的概率小于或等于0.05，若假设检验的P值比0.05越小，犯一类错误的概率就越小。

当P＞a时，做出“不拒绝其无差别的假设，还不能认为各总体间有差别”的结论时，就有可能犯第二类错误（Ⅱ型错误，type Ⅱ error），其犯错误的概率用b表示，在通常情况下犯Ⅱ类错误的概率未知，虽然b是个未知数，但假设检验P值越大，犯二类错误的概率就越小。

表4 假设检验的两类错误

真实情况	假设检验结果
真实情况	拒绝H0	不拒绝H0
样本来自同一总体	推断不正确（a）	推断正确（1-a）
样本来自不同总体	推断正确（1-b）	推断不正确（b）

3．假设检验的注意事项

（1）假设检验比较的对象是总体，而研究的方法是抽样研究，即通过对样本提供的信息去推断总体间有无差别。不能误认为假设检验是样本间的比较，更不能将此体现在结论中。如果研究方法是普查时，由于不存在抽样误差，也不存在用样本提供的信息去推断总体的问题。因此，在这种情况下也就不能使用假设检验的统计方法。

（2）当P≤a时，概率（P）越小，越有理由拒绝无差别的假设，即拒绝假设的可信程度就越大，这时概率（P）越小，其结论的可靠性就越好。当P＞a时，概率（P）越大，越有理由不拒绝无差别的假设，即不拒绝无差别假设的可信程度就越大。这时概率（P）越大，其结论的可靠性就越好。因此，无论概率P≤a，还是P＞a时，都不能说明组间差别的大小。

（3）假设检验的结论不能绝对化。假设检验的结论是根据概率（P）的大小得出的，事实上当P≤a时，我们拒绝其无差别的假设，可认为各总体间有差别，但是，只要P≠0，我们无法完全拒绝无差别的假设，即不能肯定各总体间有差别：同理，当P＞a时，我们不拒绝其无差别的假设，还不能认为各总体间有差别，但是，只要P≠1，我们无法完全接受无差别的假设，即不能肯定各总体间无差别。因此，在做出统计结论时，要避免使用绝对的或肯定的语句，如当P≤a时，使用“拒绝假设，可认为各组间有差别”；而当P＞a时，使用“不拒绝假设，还不能认为各组间有差别”的语言进行描述。

（4）假设检验的方法与设计方案和分布特征有关，如：两组比较的方法有t检验、u检验、两组秩和检验、四格表和校正四格表的c2检验等，这些方法只能用于两组比较，而不能用于多组的比较。在实际工作中错误地使用两组比较的方法代替多组比较的情况并不少见，如，三个均数比较用三个t检验、四个均数比较用六个t检验等。多组比较可用方差分析、多组秩和检验、行乘列c2检验等。t、u检验和方差分析用于正态分布的资料，不服从正态分布的资料可用秩和检验。

4．常用假设检验方法

（1）计量资料的假设检验

表5 常用计量资料假设检验方法

比较目的	应用条件	统计方法
样本与总体的比较	例数（n）较大，（任意分布）	u检验
样本与总体的比较	例数（n）较小，样本来自正态	t检验
两组资料的比较（完全随机设计）	例数（n）较大，（任意分布）	u检验
	例数（n）较小，来自正态且方差齐	成组设计的t 检验
		成组设计的秩和检验、或成组设计的t’检验、或成组设计的中位数检验
	例数（n）较小且非正态或方差不齐

配对资料的比较（配对设计）	例数（n）较大，（任意分布）	配对设计的u检验
	例数（n）较小，差值来自正态	配对设计的t 检验
	例数（n）较小，差值为非正态	配对设计的秩和检验
多组资料的比较（完全随机设计）	各组均数来自正态且方差齐	成组设计的方差分析
多组资料的比较（完全随机设计）	各组为非正态或方差不齐	成组设计的秩和检验
配伍资料的比较（配伍设计）	各组均数来自正态且方差齐	配伍设计的方差分析
配伍资料的比较（配伍设计）	各组为非正态或方差不齐	配伍设计的秩和检验

（2）计数资料的假设检验

表6 常用计数资料假设检验方法

比较目的	应用条件	统计方法
样本率与总体率的比较	N较小时	二项分布的直接法
样本率与总体率的比较	np＞5且n（1-p）＞5	二项分布的u检验
两个率或构成比的比较（完全随机设计）	np＞5且n（1-p）＞5	二项分布的u检验
	N≥40且T≥5	四格表的χ2检验
	N≥40且1≤T＜5	校正四格表的χ2检验
	N＜40或T＜1	四格表的确切概率法
配对四格表比较（配对设计）	B+c≥40	配对χ2检验
配对四格表比较（配对设计）	B+c＜40	校正配对χ2检验
多个率或构成比资料的比较（完全随机设计）	全部格子T≥5或少于1/5的格子1≤T＜5	行×列表χ2检验 (列联表χ2检验)
	全部格子T≥5或少于1/5的格子1≤T＜5
	若有T＜1或有多于1/5的格子1≤T＜5	行×列表的确切概率法（列联表确切概率法）

注：n为例数；T为列联表中各格子的理论数；p为样本率

（3）等级资料的假设检验

表7 常用等级资料假设检验方法

比较目的	统计方法
两组比较（完全随机设计）	两组比较的秩和检验
多组比较（完全随机设计）	多组比较的秩和检验
配对设计	符号秩和检验
配伍设计	配伍设计的秩和检验

四．变量间的相关分析

数据资料的比较，是同一指标的不同处理组间的比较。在临床研究工作中，常常涉及疾病危险因素的研究和疾病病因的探索，即分析某个因素与疾病间的关系，如口服女性素避孕药是否是宫内膜癌的危险因素；高血脂症是否是冠心病心肌梗塞的危险因素。如果研究结果证明了它们是某种疾病的危险因素或与某种疾病有相关关系的话，还不能肯定其是因果关系，只有当某个因素导致某个肯定的结果，若该因素消除后，其相应的结果也不复存时候，这时，因果关系才能被肯定。

1．数值变量（计量资料）的关系分析

表6 常用数值资料的关系分析方法

比较目的	应用条件	统计方法
两变量间的依存关系	正态单变量资料*	直线回归（Ⅰ型）
两变量间的依存关系	正态双变量资料**	直线回归（Ⅱ型）
两变量间的相互关系	正态双变量资料	直线相关
两变量间的相互关系	两变量都不服从正态	等级相关

注：*为两变量中有一个变量服从正态分布的资料；**为两变量都服从正态分布的资料。

2．无序分类变量（计数资料）的相关分析

（1）前瞻性研究

相对危险度（RR）= 未暴露于危险因素组的总体患病率(暴露于危险因素组的总体患病率 )

归因危险度（AR）= - 暴露于危险因素组的患病率(暴露于危险因素组的患病率未暴露于危险因素组的患病率)

（2）回顾性研究

比值比（OR）=ad/bc

2×2表：列联系数和四格表的c2检验

行×列表：列联系数和行乘列表的c2检验

3．有序分类变量（等级资料）等级相关

2016年3月8日

上一条：医学论文中英文摘要的撰写
下一条：GB/T 7714 新标准实施的要点提示《转载》

大中小【打印】【返回】

+更多期刊动态

+更多期刊目录

+更多作者园地

您当前位置：首页 > 作者园地