2019年8月17日 星期六

唔係咁科學喎




昨天港台播放的《真係好科學之唔係咁科學喎》非常有趣,請來了幾位科學專家探討坊間的保健產品的效用。節目中多次提及的一個核心問題是,我們怎樣知道一樣保健產品是否有效呢?四位專家作出了很有啟發性的討論,史丹福也覺得這個問題很重要,所以想再作一點補充。

舉個例子,街坊陳師奶跟你說:「我前陣子感冒,吃了產品X,兩日後就痊癒了,產品X真是有效。」她這個推論有沒有問題呢?

大家細心想想,陳師奶覺得自己病情好轉可以是因為「安慰劑效應」(placebo effect),即是她吃了藥後相信藥的作用,心理因素引起生理變化,少了不適的感覺。但這不是藥物的效果。即使陳師奶吃粒糖,她心裡以為這是特效藥,亦可能會引起同樣的心理影響生理效果。

節目中的專家提出,可能用保健產品的人自覺身體不好,所以多作運動,多作休息,均衡飲食,這又是陳師奶痊癒的另一個可能性。

再退後一萬步來說,其實我們根本上不知道陳師奶用了產品X之後是否更快康復,或許她不服用的話,一日後已經康復,不需要兩日呢?

那麼,我們有甚麼更有效的方法去解決以上的問題呢? 醫學界中的金科玉律是隨機對照研究(randomized controlled trial),也就是把足夠的試驗對象隨機分成兩批,一批接受A療法,一批接受B療法,然後再比較一下兩者的分別。最理想的情況下,研究是雙盲的(double blind)。也就是說,提供療法者與接受療法者都不知道用的是那一種療法,例如把兩種藥物刻意設計成外觀一樣,令提供療法者與接受療法者都無法透過外觀認得藥物,這樣就可以避免提及剛才提及的「安慰劑效應」問題。

舉例來說,如果要用隨機對照研究的方法驗證產品X的療效,我們首先要找尋足夠數量的患上感冒的試驗對象,把它們隨機地分成兩組,而且這兩組對象的性質應盡量接近。否則其中一組多是體弱多病的老年人,另一組別是年輕力壯的青年人,無論兩者使用甚麼產品,後者的效果都肯定較前者理想。至於何謂足夠的試驗對象?這個問題牽涉到統計學的計算,我們就不在此詳談了。分成兩組後,其中一組試驗對象使用產品X,另一組則使用安慰劑。安慰劑是一種模仿產品X,但其實沒有有效成分的藥劑(例如包裝成產品X的膠囊,內裡卻只有麵粉)。試驗對象並不知道自己是接受那個療法。 這個做法便把剛才提及的大部分問題都解決了。假如使用產品X的組別平均康復時間為兩天,而使用安慰者的組別平均康復時間為五天,這樣我們就有很可信的證據去證明產品X有助縮短感冒康復所需的時間。

隨機對照研究雖然很有說服力,但做起上來很困難,又要找到足夠的試驗對象,又要用公平的方法把試驗對象隨機分組,又要設計出方法確保「雙盲」的效果。因此實證醫學中也有世代研究(Cohort study)及病例及對照組研究(Case-control study)等較易執行的研究方法,但其可信度就及不上隨機對照研究了。

事實上,實證醫學中有一個很標準的方法去分辨證據的可信度,叫做「證據等級」(level of evidence)。

第一級:隨機對照研究
第二級:世代研究
第三級:病例及對照組研究
第四級:病例報告(Case series
第五級:專家意見(Expert opinion

第一級是最可信的證據,等級越低,越不可信。《真係好科學》節目中提及諾貝爾化學獎與和平獎得主Linus Pauling提出用高劑量維他命C去補身,其實這只是他的個人意見,並沒有高等級的證據去支持。那管他是諾貝爾得獎者都好,在實證醫學的角度中,這只是最低等級的第五級「專家意見」。這也許比陳師奶的意見好一點點吧,因為陳師奶連專家也說不上。

如果有十位街坊試用過產品X之後有良好效果,那在實證醫學中屬於第四級的病例報告,是較為高質量的證據。而最高質量的證據就是隨機對照研究。

希望這篇文章可以令大家認識到基本的實證醫學概念,明白到何謂一個有質素的研究。下次遇到宣稱功效神奇的保健產品時,可以更有批判性思考,認真地想想宣稱的效果是否可信,避免被誤導或者被騙。

沒有留言:

張貼留言