應(yīng)該每個醫(yī)學(xué)生都經(jīng)歷過看病理切片的痛苦吧,瞇眼盯著顯微鏡好幾分鐘“找不同”真是一大折磨,可是不經(jīng)歷這千萬次的折磨,面對某些長得特別像的腫瘤咱們就得麻爪了。比如說同屬非小細(xì)胞肺癌的肺腺癌(LUAD)和鱗狀細(xì)胞癌(LUSC),雖然兄弟倆長得很像,但是在臨床上治療選擇卻大相徑庭。
幾十年來,醫(yī)生們就是靠著訓(xùn)練有素的火眼金睛來為患者尋找診斷依據(jù)的,不過或許很快醫(yī)生們就能夠從這種乏味的重復(fù)勞動中解脫出來了。
今天發(fā)表在《自然醫(yī)學(xué)》的一項新研究帶來了紐約大學(xué)研究者的最新成果。研究者們利用大量數(shù)字化病理切片圖像重新訓(xùn)練了谷歌的深度學(xué)習(xí)算法InceptionV3,AI識別癌組織和正常組織準(zhǔn)確率達(dá)到99%,區(qū)分腺癌和鱗癌的準(zhǔn)確率達(dá)到97%,遠(yuǎn)超前人研究![1]
更令人驚訝的是,該算法能夠從切片圖像中識別肺癌常見六大基因突變,包括已有靶向療法的EGFR突變,準(zhǔn)確率能達(dá)到73%-86%。目前在單GPU上檢測一個數(shù)字切片的時間在20秒左右,研究者認(rèn)為,更新的技術(shù)加上多GPU并行處理,每個切片的檢測時間可以只有幾秒鐘!
無論發(fā)病率還是死亡率,肺癌都是我國癌癥中的頭號殺手,每年新發(fā)病例達(dá)到80萬,死亡人數(shù)則接近70萬。在占據(jù)了絕大多數(shù)的非小細(xì)胞肺癌中,肺腺癌(LUAD)和肺鱗狀細(xì)胞癌(LUSC)是兩個主要的亞型[1],而它們二者的現(xiàn)有治療方案,從常規(guī)化療到最新的靶向治療,都是截然不同的[2],所以準(zhǔn)確區(qū)分亞型就成了治療的一大關(guān)鍵。
病理組織切片是臨床上常用的分型手段。不過一是在幾十倍放大顯微鏡下,數(shù)據(jù)量巨大,二是癌細(xì)胞形態(tài)也未必有很明顯的區(qū)別能夠一下看出來,怎么能夠解放醫(yī)生的雙眼就很值得一究了。
此前有研究者利用隨機(jī)森林模型開發(fā)了病理切片的識別算法,區(qū)分腫瘤組織和正常組織的準(zhǔn)確率達(dá)到85%,亞型分型準(zhǔn)確率則達(dá)到了75%[2];另一項研究則實現(xiàn)了83%的分型準(zhǔn)確率[3]。
紐約大學(xué)的研究者們選擇了谷歌的一種開源算法InceptionV3[4],這是一種常用于分析視覺圖像的卷積神經(jīng)網(wǎng)絡(luò)(CNNs),在谷歌手里,它能夠識別一千種以上的對象,它也已經(jīng)成功被用于檢測皮膚癌癥[5]和糖尿病視網(wǎng)膜病變[6]了。
那么怎么讓AI認(rèn)識腫瘤組織和正常組織呢?給它喂知識!
研究者從基因組數(shù)據(jù)共享(GDC)數(shù)據(jù)庫中獲得了1634個數(shù)字化病理切片圖像,其中包括1176個肺部腫瘤組織和459個正常肺組織,它們又被分為三組,分別用來訓(xùn)練、驗證和檢測。
考慮到整個數(shù)字切片數(shù)據(jù)量很大,沒法直接用來分析,研究者們還把每個切片又進(jìn)一步分為512×512像素的碎片圖像,根據(jù)切片大小要分幾十到幾千份不等,平均每個切片分為約500個碎片。
不得不說機(jī)器真是聰明,吃了這些知識之后它一下就成了病理專家,區(qū)分腫瘤組織和正常組織的準(zhǔn)確率達(dá)到99%,跟真人專家達(dá)到一個水平;在區(qū)分正常組織、鱗癌組織和腺癌組織上,準(zhǔn)確率則達(dá)到了96.8%!
研究者請了三位病理學(xué)家來和AI較量,兩位專攻胸外,一位是解剖學(xué)專家??偟膩碚f,三位歷經(jīng)千錘百煉的專家,水平和AI是基本一致的。那些AI分類錯誤的切片,有50%至少有一名專家也看錯了,說明腺癌和鱗癌的區(qū)分確實很困難。此外,專家看錯的83%(45/54)切片都能夠被AI正確分類,說明這個系統(tǒng)還是很有作為二次校正使用的潛力的。
除了準(zhǔn)確,AI的另一個優(yōu)點(diǎn)就是快。一般情況下,醫(yī)生看一個切片怎么也要幾分鐘,病理組織特別復(fù)雜的情況下,或許還用動用免疫組化分析,那診斷時間就要超過24小時了。
AI就快得多了。目前研究者使用單個TeslaK20mGPU進(jìn)行分析,平均每個數(shù)字切片分為500個碎片,分析只要大概20秒,如果采用多GPU并行的方式運(yùn)行,差不多幾秒鐘就能出結(jié)果了!目前最大的障礙反而在掃描系統(tǒng)上,放大20倍的切片掃描需要2-2.5分鐘,不過FDA去年才批準(zhǔn)了最新的超高速數(shù)字化病理學(xué)掃描儀[7],相信這也不會是什么難闖的關(guān)。
研究者還在來自紐約大學(xué)的獨(dú)立數(shù)據(jù)庫中進(jìn)行了檢測,AI仍舊能夠在83%-97%的情況下正確分型??紤]到紐約大學(xué)保存的腫瘤樣本純度遠(yuǎn)遠(yuǎn)不如GDC的樣本,其中含有更多的炎癥、血管、血凝塊、壞死區(qū)域等“噪點(diǎn)”,樣本保存方式也不太一樣,研究者認(rèn)為,只要數(shù)據(jù)量上來了,準(zhǔn)確率也會隨之提升。
接下來,研究者準(zhǔn)備嘗試訓(xùn)練AI從病理切片中“看”出突變,這可是多高明的醫(yī)生都做不到的!
為了保證足夠的樣本量,研究者只選擇了突變率高于10%的基因和腺癌樣本,總共納入了320個切片、212000個碎片用于訓(xùn)練和驗證,62個切片、44000個碎片用于測試。AI猛學(xué)一頓之后,果然就能夠認(rèn)出STK11、EGFR、FAT1、SETBP1、KRAS、TP53等六個基因在肺癌中的常見突變了,準(zhǔn)確率從73%到86%不等!
而且從數(shù)據(jù)來看,面對多種類型的EGFR突變,免疫組化分析(IHC)只能檢測到最常見的兩種p.L858R和p.E746_A750del,AI還能夠檢測到更多的突變和缺失,例如p.G719A,p.L861Q和p.E709_T710delinsD。
就像我們前面說過的,EGFR已經(jīng)有了相應(yīng)的靶向治療方案;STK11存在于15-30%非小細(xì)胞肺癌中,也是一個潛在治療靶點(diǎn)[8,9];其他基因的突變情況也都具有一定的預(yù)后意義,與腫瘤的耐藥、侵襲性等特性有關(guān)。
與亞型檢測一致的是,突變檢測在獨(dú)立樣本中的準(zhǔn)確度也略有降低,而且幅度和亞型檢測相似,研究者認(rèn)為這也是由樣本制備帶來的差異,可以通過大數(shù)據(jù)訓(xùn)練來提高。
不過研究者還不知道AI到底是怎么從切片中判斷出突變的,只能猜測突變會帶來極其微小的、人類無法觀察到的變化。這就是機(jī)器學(xué)習(xí)的“黑匣子”問題了,有人覺得我不需要知道為啥,好用就行唄,也有反對的研究者提出,如果你不知道為啥,又怎么能夠百分百確定呢。
這就是研究者們下一步要做的事情了。接下來的幾個月中,研究者將使用更多不同來源的數(shù)據(jù)訓(xùn)練AI,并積極考慮商業(yè)化以便早日投入臨床。
想象一下,現(xiàn)在腫瘤測序還需要幾天到幾周不等,考慮到時間和成本,還沒法納入標(biāo)準(zhǔn)治療流程。而這項技術(shù)如果真的落現(xiàn),那么只要病理切片掃一掃,或許就能夠得到一項可行的治療方案,豈不是美哉!
當(dāng)然了,研究現(xiàn)在還是在一個比較基礎(chǔ)的階段,斯坦福大學(xué)癌癥研究所研究者DanielRubin就表示,說這項技術(shù)能夠取代目前的診斷方法還為時尚早,AI還需要更多的驗證工作,不過這項研究確實讓我們看到了人類和計算機(jī)合作的未來,也說明病理圖像中蘊(yùn)含的信息量比我們現(xiàn)在能夠利用的還要多得多[10]。
本文的通訊作者AristotelisTsirigos也在采訪中表示,AI能夠通過病理切片診斷肺癌亞型,還不意味著很快就能代替醫(yī)生的工作,但是目前來說,AI已經(jīng)可以幫助醫(yī)生減少讀片錯誤了[11]。
希望未來這些基礎(chǔ)工作能夠都交給機(jī)器來做,真正解放醫(yī)生去處理更多更重要的臨床決斷。
抗癌,消炎,平喘。用于食道癌、胃癌、肺癌,對大腸癌、宮頸癌、白血病等多種惡性腫瘤,亦有一定療效,亦可配合放療、化療及手術(shù)后治療。并用于治療慢性氣管炎及支氣管哮喘。
健客價: ¥16.9破血消瘦,攻毒蝕瘡。用于原發(fā)性肝癌、肺癌、直腸癌、惡性淋巴瘤、婦科惡性腫瘤等。
健客價: ¥24.9本品單藥適用于表皮生長因子受體(EGFR)基因具有敏感突變的局部晚期或轉(zhuǎn)移性非小細(xì)胞癌(NSCLC)患者的一線治療以及既往接受過化學(xué)治療的局部晚期或轉(zhuǎn)移性非小細(xì)胞癌(NSCLC)。詳見說明書。
健客價: ¥2359適用于惡性淋巴瘤、多發(fā)性骨髓瘤、淋巴細(xì)胞白血病、神母細(xì)胞瘤、卵巢癌、乳癌以及各種肉瘤及肺癌等。
健客價: ¥311、各型急性白血病,特別是急性淋巴細(xì)胞白血病、惡性淋巴瘤、非何杰金氏淋巴瘤和蕈樣肉芽腫、多發(fā)性骨髓病。2、頭頸部癌、肺癌、各種軟組織肉瘤、銀屑病。3、乳腺癌、卵巢癌、宮頸癌、惡性葡萄胎、絨毛膜上皮癌、
健客價: ¥139抗癌藥。用于肺癌、肺癌腦轉(zhuǎn)移,消化道腫瘤及肝癌的輔助治療。
健客價: ¥47.9