張斌、蔡雅雯
近年,生医产业领域最受瞩目的焦点为各式抗癌药物在临床试验解盲后,治疗组与对照组是否达到统计显著差异水平,此一结果不仅影响瞬息万变的投资市场更攸关病人的福祉。而临床试验的设计、执行方式、统计分析等环节皆须严谨,以免偏误(bias)和随机性错误(random Error)影响试验结果。而「随机双盲安慰剂对照试验」(randomized double blind placebo control)是临床试验中的经典方法,众所周知,试验设计在一项研究中起着至关重要的作用。它往往决定着一个试验的成败。这也是为什么统计学家一再强调,如果实验设计不合理,数据收集的再好也是无用的数据,不能达到试验的目的。在临床试验中,随机分组方法或随机对照试验作为基本原则之一,其在科学研究中的重要性已经得到了大家的公认,尤其是针对新药物或者新疗法的有效性的试验。而在试验设计里,人们往往更重视检验假设和样本量的计算,而忽视了其中至为关键的随机方法。各种医学文献中有不少指出了如果随机方法运用的不正确,或者实验过程中没有做到随机分配,则会影响其统计意义。然而却很少有人指出为什么会产生未达到真正随机分配的原因。
根据Christian Gluud于2006年发表于肝胆领域的研究,每年约有超过500篇肝胆领域的随机试验发表,大约只有48%的试验产生合宜的的分派序号(allocation sequence),38%有进行分派保密(allocation concealment),34%具适当的双盲设计(double blinding),发现有超过九成的肝胆试验设计都可能产生偏误,使得干预组的效果被高估1。此外,2017年John Carlisle研究自2000年到2015年间,分别来自麻醉学领域与非麻醉学领域共8份期刊,共5087份的随机对照试验 (randomized, controlled trials)中,约有1.6%的p值呈现极端分布,这些都有可能是由于随机抽样不当所导致的结果,也导致部分期刊撤回数篇论文2。
而类似因研究设计、统计错误的案例导致研究结果失真的案例更是时有所闻。读者虽然知道未达到真正随机分配的后果,却不知道其原因,也不知道该如何做才能避免此类事情的发生。因此,我们这里重点阐述随机的意义和实验中未能做到真正随机的原因。
在医学实验中,尤其是有效性的实验中,随机对照试验一直是金标准。好的随機方法从最大程度上消除了每个研究组之间由于样本本身的原因,如年龄、性别等,造成的差异,以此减少实验偏差以增加实验结果的可靠性。很多人一说到随机,就会想到教科書中的擲硬币例子,觉得现实生活或者科学实验里的随机也不过是扔硬币确定分组那么简单。可是实际情况真的是这样吗?举个简单的例子,我们想比较两种疗法A和B,需要把40名病人按照1:1的比例随机分到两个组。如果采用简单随机,也就是通常所说的抛硬币法,那么有可能前20名病人都被随机到一个组,而后20名病人被随机到另一个组。或者,碰巧20名男病人接受A疗法而另外20名女病人接受了B疗法。又或者一个医生的20个病人都接受了A疗法而另外一个医生的20个病人都接受了B疗法。乍看之下,还是符合1:1的要求,可是我们都知道这样的随机序列是不合理的。这样的随机会产生偏倚,导致结果丧失了可信度。所以很多时候候我们需要对产生随机序列的过程加以控制,使最终的结果做到真正的随机。比如,使用区组随机化(blocked randomization)就是其中广泛使用的一种方法。也就是,在做随机的时候,与其对整体产生随机序列,我们对整体进行分组再做随机。我们还以上述例子为例,与其对40个病人整体产生随机序列,我们按顺序对每4个人一个小组进行随机分配,确保每个小组都有2名病人接受疗法A,2名病人接受疗法B。这样就可以避免前20个病人或后20个病人接受同一种疗法的情况。同样的道理,我们可以对性别或者其他的因素进行控制。乍看之下,这种方法很好理解,然而,区组随机也不是简单就能实现的。区组的大小该如何选择,随即序列的产生使用何种算法,都从某种程度上决定了随机方法是否准确,进而影响整个试验的结果。以上述的例子而言,如果我们使用区组随机,可是区组长度过小,比如长度为2,也就是说每两个连续的病人里一定有一个会被随机到A组而另一个随机到B组。看似是一个很公平的随机方法,可是在某些试验中却是致命的,比如单盲试验。因为医生知道前一个病人被分配到A组后,他就知道下一个一定是B组,因此会产生主观偏差。所以即使是看似简单的区组随机也需要研究人员注意使用正确的方法产生相应的随即序列。
在不同的情况下,除了简单随机和区组随机,临床试验中还需要使用其它的随机方法,比如分层/分段随机(stratified randomization)、分层区组随机(stratified blocked randomization)、共變量應變式隨機(covariate adaptive randomization)等等。尤其在较为复杂的试验里,如何使用正确的随机方法是很多研究工作者需要谨慎思考,並諮詢統計專家。由于篇幅所限,本篇不逐一羅列,有兴趣的读者可以查询相关资料。因此,在试验设计里,除了關注样本量的数字,研究人员也不能忽视随机方法。否则可能产生难以挽回的错误而使整个实验前功尽弃。看完这篇大家不妨想想,你做的随机,是真的随机吗?
註釋
- Gluud, C. The culture of designing hepato-biliary randomised trials. J Hepatol. 2006 Mar;44(3):607-15. 返回內文
- J. B. Carlisle, Data fabrication and other reasons for non-random sampling in 5087 randomised, controlled trials in anaesthetic and general medical journals. Anaesthesia. 2017 Aug;72(8):944-952. 返回內文
張斌
- 學歷:博士,統計,密蘇里大學(University of Missouri)
- 經歷:副教授,辛辛那提兒童醫學中心,兒童醫學科-統計暨流行病學組【12/2014~迄今】、助理教授,辛辛那提兒童醫學中心,兒童醫學科-統計暨流行病學組 (Cincinnati Children’s Hospital Medical Center)【01/2012-12/2014】
- 專長:醫療大數據分析、存活分析(Survival analysis)、縱貫性研究 ( longitudinal study)、臨床試驗分析 (clinical trial)、實驗設計
- Email:bin.zhang@cchmc.org
蔡雅雯
- 學歷:國立中山大學,生物醫學研究所,博士班【09/2017~迄今】、輔英科技大學,醫事技術系,碩士【09/2008~06/2010】
- 經歷:永康奇美醫院,病理中心,醫事檢驗師【02/2011~迄今】、美國阿拉巴馬州立大學 (University of Alabama at Birmingham, UAB)癌症研究中心,生物統計暨生物資訊組,研究員【01/2010~05/2010】
- 專長:醫學實驗室認證 (ISO 15189)、統計分析(SPSS, SAS)
- Email:rositatsai@gmail.com