黃浥暐
壹、新訊快遞*
2017年6月,英國麻醉師兼《麻醉學》(Anaesthesia)雜誌編輯John Carlisle發表了一篇研究,指出許多已發表的臨床試驗皆可能存在統計錯誤。研究範圍橫跨八個期刊已發表的論文,並以電腦程式分析參與試驗者的某些特徵,例如身高、體重和年齡之分佈。結果發現,大約有2%的論文並未達到真正的「隨機分配」試驗標準,可能影響其統計意義。在這些被提出可能有問題的論文中,有部分期刊未採取行動、有部分期刊則已著手進行調查。其中知名醫學期刊《新英格蘭醫學雜誌》(New England Journal of Medicine, NEJM)重新更正了五篇論文,另有一篇關於地中海飲食是否有助於預防心臟病的論文在撤回後重新發表。
貳、評析
隨機對照臨床試驗(randomized, controlled trials, RCTs)是目前用來測試新型藥物或療法的黃金標準,針對上市前新產品的效力與安全性進行測試。「隨機」(randomized),即研究人員隨機分配受試者至實驗組(接受待測療法)或對照組(未接受待測療法);對照(controlled),即相對於接受治療的實驗組,使另一群人接受安慰劑或虛假的治療作為參考。透過「隨機分配」與「對照組」的存在,可減少實驗偏差、確保其測試結果的可靠性和有效性。如果結果表明該療法的效果符合其聲稱之益處,並且不會引起對人體不安全的不良反應,美國食品和藥物管理局(FDA)才會認可一種新的治療方法為安全有效,並可被更廣泛地使用。
隨機分配的重要性
研究中因人為的選擇產生結果的偏倚稱為「選擇偏差」(selection bias),而隨機分配可防止人為偏倚或刻意操縱研究結果,透過刪除選擇的元素來消除選擇偏差。舉例來說,如果沒有隨機化,科學家可能會有意識地或潛意識地將較可能從實驗治療中獲益的患者分配至實驗組,這可能使治療看起來比實際更有益;相反地,如果科學家希望證明某種治療的無效性或潛在危險,他們可能會將併發症風險較高或成功機率較低的患者分配至實驗組,以證明其觀點。尤其是從製藥公司獲得直接或間接資金贊助的研究者,更可能在試驗中選擇偏倚,以證明新藥的有效性和安全性。即使出於善意的動機,選擇偏差亦會在科學上產生不公正的影響。例如,若醫生懷疑新療法可能對某類型的病患產生嚴重的副作用,可能會試圖保護這些病患免受藥物侵害而對受試對象進行篩選。然而,在臨床試驗中以不同方式治療不同的受試者會降低類似比較的完整性,從而產生錯誤的結果1。
簡言之,隨機分配臨床試驗參與者至實驗組或對照組,才能讓兩組別的成員條件更加平均,使療效能較公平地進行直接比較,並真實反映藥物如何在更廣泛的人群中發生反應。
可能失真的統計結果
同時身為麻醉師及《麻醉學》(Anaesthesia)雜誌的編輯,John Carlisle發現許多麻醉學臨床試驗的論文因數據分佈不均的問題而受到撤回,特別是年齡、體重和身高等基準特徵。為了深入探討此問題,他檢視了2000~2015年間來自八個期刊的五千多篇論文,以程式分析其基準特徵的分佈與變異性2,如果數據的分佈太集中或是太分散,可能代表這些研究並非真正的隨機分配,無論是出於刻意的科學不當行為(scientific misconduct)還是誠實錯誤(honest mistake)。分析的結果發現,大約有2%的論文落於這個可能有統計問題的類別。
儘管此研究的發表提出了問題的可能性,真正的答案仍須期刊執行進一步的介入與調查。身為醫學指標性期刊之一的《新英格蘭醫學雜誌》(New England Journal of Medicine, NEJM),已經瞄準了研究中所列11篇具有最嚴重警示的論文進行調查,其中六篇被證實存在錯誤。在五個案例中,問題是統計術語的混用,例如,混淆代表測量數據之間差異的「標準差」 (standard deviation),與取決於樣本大小的「標準誤差」 (standard error)。但是在另一個案例中,確實發現了因未達成隨機分配而造成統計結果失真的錯誤:2013年在西班牙發佈、包含全國近7500人參加長達15年的大型臨床試驗,欲探討地中海飲食是否有助於預防心血管疾病。經過西班牙研究人員和NEJM工作人員長達數月的調查,發現試驗中有多達1588人未被正確隨機分配。例如,為了研究的便利性,同一家庭的成員被分配到相同的飲食群組中;或是生活在農村地區的人根據離他們最近的診所分配飲食群組,使得飲食的分配以診所為單位集團隨機化,而非以個人為單位。最後作者在除去1588名參與者數據的情況下重新分析了他們的數據,並發現儘管存在失誤但結論仍然有效:堅果,橄欖油和魚類對心血管健康仍有整體而言的好處,只是結論與原始論文相比統計上的意義變弱了。
NEJM編輯對期刊中發現的統計錯誤感到不安,並欲於接受的論文中實施額外的統計審查,但並非所有被提出問題的期刊都願意執行進一步調查。根據《科學》雜誌(Science)的追訪,其中《加拿大麻醉期刊》(Canadian Journal of Anesthesia)的主編稱調查正在進行中,但由於資源有限使調查進展緩慢;另一本期刊《麻醉學》(Anesthesiology)的編輯們查看了這些論文後,認為沒有理由撤回其中任何一篇文章;其他期刊有的沒有回覆、有的選擇不進行調查。畢竟無論對於論文作者或是雜誌本身,重新探查過去臨床試驗對象的數據與分配情形都將耗費大量的時間與金錢。
無論如何,Carlisle的研究都點出了隨機對照臨床試驗理應達成的基本條件—隨機分配—實際上卻存在不少漏網之魚的現況,即使是高公信度期刊的研究亦難以避免,而其結論又經常被奉為圭臬,諸如當年「地中海飲食可降低心血管疾病發病率」研究一出後各界對地中海飲食的大力推廣。此外,其糾錯與審查機制目前仍仰賴期刊的自主調查,但由於需投入的資源過高,降低了啟動調查的意願。無論是研究人員或是期刊,都應更加正視此類統計問題,方能使隨機對照臨床試驗真實反映對於廣泛人群的代表性,使研究結果具有真正的統計意義。
參、延伸閱讀
- 張家勳;陳建煒,臺灣實證醫學的展望,台灣醫學,2003年7月,7卷4期,575-578頁。
註釋
- C. Y. Tachibana. " Stem-cell culture moves to the third dimension ". Nature 558, 329-331 (2018) doi: 10.1038/d41586-018-05380-x。https://www.nature.com/articles/d41586-018-05380-x?utm_source=fbk_nnc&utm_medium=social&utm_campaign=naturenews&sf191502440=1 (Last visited: Dec. 27, 2018) 返回內文
- MacGill, Markus. "What is a randomized controlled trial?." Medical News Today. MediLexicon, Intl., 4 Dec. 2018. https://www.medicalnewstoday.com/articles/280574.php (Last visited: Feb.19 2019) 返回內文
- J. B. Carlisle, Data fabrication and other reasons for non-random sampling in 5087 randomised, controlled trials in anaesthetic and general medical journals. Anaesthesia, June 2017. DOI: 10.1111/anae.13938 返回內文