人類醫(yī)生在心臟病發(fā)病風(fēng)險的預(yù)測上也失守了!
上周五,《科學(xué)》雜志報道了英國諾丁漢大學(xué)流行病學(xué)家Stephen Weng博士團隊發(fā)表在《PLOS ONE》上的重要研究成果,Weng博士團隊將機器學(xué)習(xí)算法應(yīng)用于電子病歷的常規(guī)數(shù)據(jù)分析,發(fā)現(xiàn)與當(dāng)前的心臟病預(yù)測方法相比,機器學(xué)習(xí)算法不僅可以更準(zhǔn)確地預(yù)測心臟病發(fā)病風(fēng)險,還可以降低假陽性患者數(shù)量。人工智能再一次戰(zhàn)勝人類。
Stephen Weng博士“這項研究的重要性再怎么強調(diào)都不過分”,沒有參與這項研究的斯坦福大學(xué)血管外科醫(yī)生Elsie Ross博士在接受《科學(xué)》雜志采訪時表示,“我真的希望醫(yī)生敞開胸懷擁抱人工智能,利用這個工具更好地幫助患者。”
我相信大部分心血管醫(yī)生對人工智能的期待與Ross博士一樣。因為據(jù)世界衛(wèi)生組織統(tǒng)計,在2012年,全球非傳染病導(dǎo)致的死亡人數(shù)為3800萬,其中心血管疾病(心臟病和中風(fēng)等)為1750萬人,占所有非傳染疾病導(dǎo)致死亡病例的46.2%;而讓人感到畏懼的癌癥導(dǎo)致的死亡為820萬,占所有非傳染疾病導(dǎo)致死亡病例的21.7%。心血管疾病的預(yù)防與治療確實刻不容緩。
實際上科學(xué)家也一直在努力尋找與心腦血管疾病相關(guān)的風(fēng)險因子,以達到預(yù)防疾病的目的。例如美國心臟病學(xué)院與美國心臟病協(xié)會(American College of Cardiology/American Heart Association;ACC/AHA)等機構(gòu)通過多年的研究,將高血壓、膽固醇、年齡、吸煙和糖尿病等一系列因素列為與心血管疾病風(fēng)險高相關(guān)的因素,并推出了ACC/AHA預(yù)測模型。除此之外,還有其他組織機構(gòu)推出的QRISK2、Framingham和Reynolds等預(yù)測模型。
ACC/AHA的預(yù)測主要風(fēng)險因子組合。然而,在Weng博士看來,這些方法都不給力。因為所有標(biāo)準(zhǔn)的心血管病風(fēng)險評估模型都有一個隱含的假設(shè),即每個風(fēng)險因子與心血管疾病之間的關(guān)系都是線性的,這些模型可能過度簡化了它們之間的關(guān)系。
相對于復(fù)雜的生命活動,這顯然太簡單了,無法揭示患者服用的藥物,或其他疾病和生活方式因素對疾病的影響。甚至還有一些因素是反直覺的,很多人認(rèn)為脂肪對身體有害,會增加健康人患心血管疾病的風(fēng)險。但在一些情況下,它實際上是保護心臟的。“這些例外在人體內(nèi)實實在在地發(fā)生,”Weng博士說,“計算科學(xué)給了我們探索那些復(fù)雜關(guān)系的機會。”
為了探索利用機器學(xué)習(xí)預(yù)測心血管病發(fā)病風(fēng)險的方法,Weng博士團隊從Clinical Practice Research Datalink(CPRD)數(shù)據(jù)庫篩選了378256名符合標(biāo)準(zhǔn)居民的10年(2005年1月1日起)電子病歷,這些居民在2005年都是各方面指標(biāo)正常的健康人。
然后隨機將這個龐大的數(shù)據(jù)庫分成兩份,其中295267(78%)個居民的電子病歷,用來訓(xùn)練機器學(xué)習(xí)算法,剩下的82989個居民的10年電子病歷用來驗證算法的準(zhǔn)確性。據(jù)Weng博士了解,這是全世界范圍內(nèi),首次在如此大規(guī)模的群體中,使用機器學(xué)習(xí)預(yù)測人類患心血管疾病的風(fēng)險。
為了找到更合適的機器學(xué)習(xí)算法,Weng博士和其同事采用了4種機器學(xué)習(xí)算法,它們分別是:隨機森林(random forest)、邏輯回歸(logistic regression)、梯度提升(gradient boosting)和神經(jīng)網(wǎng)絡(luò)(neural networks)。將ACC/AHA模型作為對照。
第一步工作是讓4種機器學(xué)習(xí)算法在沒有人類指示的情況下,通過分析295267的電子病歷數(shù)據(jù),各自“創(chuàng)造”一個預(yù)測模型。當(dāng)研究人員將標(biāo)準(zhǔn)化的數(shù)據(jù)“喂”給這四種算法之后,它們很快找到了各自認(rèn)為的與心血管病發(fā)生相關(guān)性較高的風(fēng)險因子。
在這一步,機器學(xué)習(xí)算法就顯現(xiàn)出了它的優(yōu)勢。與ACC/AHA指南相比,年齡、性別和吸煙三項風(fēng)險因素,也被四種機器學(xué)習(xí)算法列為首要風(fēng)險因素。然而,現(xiàn)行的許多心血管疾病算法認(rèn)為糖尿病是風(fēng)險因子之一,四種機器學(xué)習(xí)模型要么不考慮這項因素,要么只認(rèn)為糖化血紅蛋白是風(fēng)險因素。
四種機器學(xué)習(xí)算法自己“摸索”出來的重要風(fēng)險因子更有意思的是,這四種機器學(xué)習(xí)模型認(rèn)為房顫、種族差異、慢性腎病、慢性阻塞性肺疾病和嚴(yán)重精神病等疾病,以及是否服用皮質(zhì)類固醇,以及甘油三酯水平等生物標(biāo)志物等是重要風(fēng)險因素。但是這些在現(xiàn)存的模型里都是不存在的。
這再一次表明,機器學(xué)習(xí)可以幫助研究人員發(fā)現(xiàn)一些潛在的風(fēng)險因子,這些變量憑人力是很難發(fā)現(xiàn)的,但是機器學(xué)習(xí)可以從其他變量中推斷出來。那機器學(xué)習(xí)的這幾套模型到底靠譜嗎?
第二步,Weng博士將四種機器學(xué)習(xí)算法自主建立的模型與ACC/AHA模型進行比較,讓它們分別預(yù)測剩下的82989個居民哪些10年后會患心血管疾病(實際總發(fā)病人數(shù)為7404人,當(dāng)然研究人員沒有把這個信息告訴深度學(xué)習(xí)模型),哪些不會發(fā)病。
不難看出,四種機器算法自主創(chuàng)建的模型要優(yōu)于ACC/AHA模型。隨機森林模型的敏感性比ACC/AHA高出2.6%,邏輯回歸模型的敏感性比ACC/AHA高出4.4%,梯度提升機和神經(jīng)網(wǎng)絡(luò)模型的敏感性比ACC/AHA高出4.8%。從本研究的結(jié)果看來,最好的神經(jīng)網(wǎng)絡(luò)算法比傳統(tǒng)模型多正確預(yù)測了355個居民的發(fā)病風(fēng)險。這意味著,在更大的人群里,將有數(shù)以萬計的人會因此而得救。
然而,我們也不難發(fā)現(xiàn),即使引入機器學(xué)習(xí)算法之后,還有30%以上的高風(fēng)險居民沒有被提前預(yù)測出來。這意味著深度學(xué)習(xí)算法還需要大幅改進。Weng希望在將來能將更多的生活因素和遺傳因素納入分析范圍,進而提升其精確度。
這件事情卻未必那么容易。因為機器學(xué)習(xí)算法就像“黑箱”,你輸入數(shù)據(jù),它反饋結(jié)果,然而在這個黑箱之中到底發(fā)生了什么,目前研究人員是很難知道的,這使得科學(xué)家難以在算法上做調(diào)整。不過,科學(xué)家正在努力改進這一現(xiàn)狀,爭取實現(xiàn)數(shù)據(jù)處理過程的可視化。
相較于人工智能在常規(guī)電子病歷上的應(yīng)用而言,人工智能在影像學(xué)領(lǐng)域的科研和應(yīng)用正可謂如日中天。尤其是2015年底,Google和Facebook先后公開自家的深度學(xué)習(xí)算法TensorFlow和Big Sur,帶動了基于圖像識別的深度學(xué)習(xí)算法在醫(yī)療領(lǐng)域的爆發(fā)式發(fā)展。
基于圖片識別的人工智能目前在皮膚癌、糖尿病視網(wǎng)膜病變和先天性白內(nèi)障等疾病的輔助診斷上已經(jīng)達到或超過專業(yè)醫(yī)生的水準(zhǔn)。今年年初FDA批準(zhǔn)了全球首個深度學(xué)習(xí)影像臨床應(yīng)用平臺Arterys Cardio DL,意味著深度學(xué)習(xí)技術(shù)正逐漸獲得認(rèn)可。
目前國內(nèi)同行也在積極布局人工智能在醫(yī)療領(lǐng)域的應(yīng)用,例如致力于醫(yī)療影像的智能診斷和大數(shù)據(jù)分析的慧影醫(yī)療,在今年3月底聯(lián)合七喜醫(yī)療發(fā)布了全球首款智能DR。
而致力于在眼底、X-Ray和頭頸癌MRI等各個科室影像的診斷與科研的肽積木,首創(chuàng)將深度網(wǎng)絡(luò)應(yīng)用于病灶識別標(biāo)記及病程判斷,可在13~15秒內(nèi)完成一張病灶標(biāo)記,遠快于3~5分鐘的行業(yè)標(biāo)準(zhǔn),實際場景已超過醫(yī)生準(zhǔn)確率,在特定數(shù)據(jù)集準(zhǔn)確度超過97%。從眼底照片的閱讀與識別入手,肽積木在糖尿病視網(wǎng)膜病的等級識別方面已持平國際頂級醫(yī)生。
盡管國內(nèi)處于輔助診斷階段的人工智能平臺,在準(zhǔn)確度上也已經(jīng)達到或超過醫(yī)生的水平,但是在政策、技術(shù)、倫理,以及教育方面仍有不少問題需要突破。不過,2017年3月,人工智能首次被列入政府工作報告中。國家將加大在人工智能領(lǐng)域的投入,在未來的5-10年,這個產(chǎn)業(yè)或許會發(fā)生很大的變化。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。