深度學習對非小細胞肺癌病理切片的分類和突變基因預測
- 2019 年 10 月 7 日
- 筆記
眾所周知,人工智慧在醫學領域內進軍最為迅速的是影像科,而病理科作為醫院內也有大量數據的科室,也是AI可以大展身手的地方。大多數疾病的診斷,病理結果還是「金標準」,而在此過程中病變組織的病理切片就顯得尤為重要,尤其是腫瘤組織的良惡判斷、分型、分期;同時病理科醫生也每天埋頭於組織切片的製備與判讀中,那麼AI的快速發展能否為病理科醫生分擔一些重任了?
最近(2018-09-17)發表在《Nature Medicine》上的一項研究就為病理科醫生以及腫瘤科醫生(研究者)帶來了新的曙光,該項研究是由紐約大學醫學院完成的,他們的研究表明利用深度學習可以對非小細胞肺癌的病理切片結果進行分類以及突變基因的預測。
研 究 簡 介
研究標題: Classification and mutation prediction from non-small cell lung cancer histopathology imgesa using deep learning
發表雜誌: Nature Medicine (IF:32.621)
發表日期:2018-09-17
研究者:Nicolas Coudray, Paolo Santiago Ocampo, Theodore Sakellaropoulos, Navneet Narula, Matija Snuderl, David Fenyö, Andre L. Moreira, Narges Razavian,Aristotelis Tsirigos
研究單位:NYU School of Medicine
1背景介紹
組織病理學載玻片是目前病理科醫生家評估肺癌進展階段、分類和分型的主要方法之一。腺癌(LUAD)和鱗狀細胞癌(LUSC)是最常見的肺癌亞型,它們的區別需要經驗豐富的病理科醫生。
2研究方法
在該項研究中,研究者在從癌症基因組圖譜獲得的全幻燈片影像上訓練了一個深度卷積神經網路(初始v3),以準確和自動地將它們分類為腺癌、鱗狀細胞癌或正常肺組織。

圖1:該研究中所用的數據和方法。
3研究結果
(1)肺癌分類:該方法的表現與病理學家的表現相當,模型評價ROC曲線下的平均面積(AUC)為0.97。

圖2:深度學習對非小細胞肺癌的識別與分類。
(2)突變基因預測:該研究的模型在冰凍組織、福爾馬林固定的石蠟包埋組織和活組織檢查的獨立數據集上得到驗證。此外,該訓練網路預測腺癌中十個最常見的突變基因。發現其中6個:STK11、EGFR、FAT1、SETBP1、KRAS和TP53-可以從病理影像中預測,在人群中測量的AUC為0.733-0.856。

圖3:深度學習通過病理切片對非小細胞肺癌基因突變的預測情況。

圖4:深度學習預測非小細胞肺癌基因突變的空間異質性。
4研究討論
研究者認為他們的研究結果表明,深度學習模型可以幫助病理科醫生檢測癌症亞型或基因突變。他們的的方法可以應用於任何癌症類型,程式碼可在以下處獲得:https://github.com/ncoudray/DeepPATH

研 究 解 讀
1.疾病治療角度
該研究主要發現了一種AI或「深度學習」程式可以區分出肺癌的亞型:腺癌和鱗狀細胞癌,且其準確率達到了97%。
該深度學習程式還能夠確定細胞中與肺癌相關的6種基因(STK11、EGFR、FAT1、SETBP1、KRAS和TP53)的突變情況,其準確度範圍為73%-86%,具體取決於基因。這種遺傳變化或突變通常會導致癌症細胞出現異常增殖,也可以改變細胞的形態以及細胞與周圍環境的相互作用,為自動分析提供視覺線索。
研究人員表示,確定每種腫瘤中哪些基因發生突變對於增加靶向治療的使用至關重要,這些治療僅對具有特定突變的癌細胞起作用。例如,已知大約20%的腺癌患者有EGFR有突變,可以用EGFR的靶向治療藥物。
但研究作者表示,目前用於確認突變存在的基因檢測可能需要數周時間才能返回結果。
紐約大學朗格尼爾森林癌症中心病理學系副教授Aristotelis Tsirigos博士說:癌症的早發現早治療特別重要,該研究提供了強有力的證據,證明AI方法能夠立即確定癌症亞型和基因突變譜,從而使患者能夠儘早接受靶向治療。
2.人工智慧/深度學習角度
在目前的研究中,研究團隊設計了統計技術,使他們的程式能夠「學習」如何在任務中變得更好,但卻沒有被告知究竟如何。這些程式構建規則和數學模型,使得能夠基於數據示例進行決策,隨著訓練數據量的增長,程式變得「更加智慧」。
受大腦中神經細胞網路啟發的較新的AI方法使用越來越複雜的電路來分層處理資訊,每一步都將資訊輸入下一步,並在此過程中為每條資訊分配或多或少的重要性。
目前的團隊訓練了一個深度卷積神經網路:Google的Inception v3,來分析從癌症基因組圖譜獲得的幻燈片影像,這是一個已經確定的癌症診斷影像的資料庫。這讓研究人員可以測量他們的程式是如何訓練的,以準確和自動地對正常組織與患病組織進行分類。
有趣的是,該研究發現,研究AI程式錯誤分類的小部分腫瘤影像中,約有一半也被醫生錯誤分類,突出了區分兩種肺癌類型的難度。另一方面,研究中至少一名病理醫生錯誤分類的54張影像中有45張被機器學習程式指定為正確的癌症類型,這表明AI可以提供有用的第二意見。
研究的另一個作者放射學與人口健康系助理教授Narges Razavian博士說:在該研究中,他們能夠提高病理醫生診斷的準確度,並表明AI可以發現癌細胞及其周圍組織的可見特徵中以前未知的模式。數據和計算能力之間的協同作用正在創造前所未有的機會,以改善醫學實踐和科學。
3.未來前景
未來該團隊計劃繼續使用數據對其AI程式進行培訓,直到它能夠確定哪些基因在特定癌症中突變,準確度超過90%,此時他們將開始尋求政府批准在臨床上使用該技術,並且幾種癌症類型的診斷。

參考文獻:
1.Coudray N, Ocampo P S, Sakellaropoulos T, et al. Classification and mutation prediction from non–small cell lung cancer histopathology images using deep learning[J]. Nature Medicine, 2018.
2.2018(18).ScienceDaily:
Artificial intelligence can determine lung cancer type.