準確率遠超人類病理學家！谷歌用深度學習算法檢測癌症

2017-03-06 23:13:00.0

雷鋒網AI科技評論按：爲了解決診斷時間有限和診斷結果不一致的問題，谷歌研究院正在研究如何讓深度學習在數字病理學領域發揮作用，通過創建一個自動檢測算法，在病理學家的工作流中提供輔助工具。本文作者爲谷歌的技術主管Martin Stumpe和產品經理Lily Peng，由雷鋒網(公衆號：雷鋒網)AI科技評論編譯。

在檢查患者的生物組織樣品後，病理學家的報告通常是許多疾病的黃金診斷標準。特別是對於癌症，病理學家的診斷對患者的治療具有深遠的影響。病理切片審查是一個非常複雜的任務，需要多年的培訓才能做好，豐富的專業知識和經驗也是必不可少的。

儘管都經過培訓，但不同病理學家對同一患者給出的診斷結果，可能存在實質性的差異，而這可能導致誤診。例如，在某些類型的乳腺癌診斷中，診斷結論一致性竟低至48％，前列腺癌診斷的一致性也同樣很低。診斷缺乏一致性低並不少見，因爲如果想做出準確的診斷，必須檢查大量的信息。病理學家通常只負責審查一張切片上所有可見的生物組織。然而，每個患者可能有許多病理切片，假設以40倍的放大倍數進行數字化切片圖像，每個患者的圖像數據都超過10億個像素點。想象一下，要遍歷1張1千萬像素的照片，並且必須對每個像素的判斷結果負責。不用說了，這裏有太多的數據需要檢查，而時間往往是有限的。

爲了解決診斷時間有限和診斷結果不一致的問題，我們正在研究如何讓深度學習數字病理學領域發揮作用，通過創建一個自動檢測算法，在病理學家的工作流中提供輔助工具。谷歌研究院使用由Radboud大學醫學中心提供圖像數據來訓練診斷算法，這些圖片也在2016 ISBI Camelyon Challenge中使用，目前該算法已被優化，用於定位出乳腺癌向乳房相鄰的淋巴結擴散。

在乳腺癌擴散定位任務中，使用現成的標準深度學習方法如Inception（也稱爲GoogLeNet），表現也是相當不錯，雖然生成的腫瘤概率預測熱圖還是存在噪點。我們對這個訓練網絡做了增強定製，包括用不同的放大倍數的圖片來訓練模型（非常像病理學家所做的），從訓練結果來看，我們有可能訓練出一個系統，它的能力可以相當於一個病理學家，甚至有可能超過病理學家的表現，並且它擁有無限的時間來檢查病理切片。

圖1 左圖是來自兩個淋巴結活檢的圖像，中圖是早期深度學習算法檢測腫瘤的結果，右圖是我們當前的成果，注意第二個版本的可見噪聲（潛在誤判）已降低。

事實上，由該算法產生的預測熱圖已經改善了很多，該算法的定位得分（FROC）達到89％，明顯超過沒有時間約束的病理學家，他們的得分僅爲73％。我們不是唯一一組認爲這種方法是有希望的，其他組別的算法模型在同一數據集中獲得了高達81％的分數。對我們來說更令人興奮的是，我們的模型魯棒性非常強，從不同的醫院使用不同的掃描儀獲得的圖像都可以識別。相關的詳細信息，請參閱谷歌研究院的相關文章「在千兆像素病理圖像上檢測癌症轉移」。

圖2 淋巴結活檢的特寫鏡頭。組織包含乳腺癌轉移以及巨噬細胞，其看起來與腫瘤相似，但是是良性正常組織。我們的算法成功識別腫瘤區域（亮綠色），不會被巨噬細胞干擾。

雖然這些結果看來振奮人心，但有幾個重要的注意事項需要考慮：

· 像大多數指標一樣，本地化的FROC分數並不是完美的。在這裏，FROC分數定義是預設帶有少量假陽性的靈敏度，假陽性是指將正常組織錯判爲腫瘤，靈敏度則是每個載玻片所檢測到腫瘤的百分比。但病理學家很少做假陽性的誤判，例如上述73％的得分對應於73％的靈敏度和零假陽性。相比之下，假設允許更多的假陽性個數，我們的算法的靈敏度可以提升。如果每個載玻片允許有8個假陽性，我們的算法的靈敏度可達到92％。

· 這些算法在執行訓練過的任務時表現良好，但相比人類病理學家，還是缺少豐富的知識和經驗。人類病理學家可以檢測出模型還沒有訓練的異常分類，例如炎症過程、自身免疫疾病或其他類型的癌症。

· 爲了確保患者得到最佳的臨牀結果，這些算法需要作爲病理學家的輔助工具，融入到他們的工作流中。我們設想我們的算法可以提高病理學家的診斷效率和診斷結果的一致性。例如，病理學家可以通過重點排查最靠前的腫瘤預測區域，以及每個載玻片多達8個假陽性區域，來降低其假陰性率，假陰性是指未檢出腫瘤的百分比。另外，這些算法可以讓病理學家準確地測量腫瘤大小，這與腫瘤預測的結果相關。

訓練模型只是將有趣的研究轉化爲真實產品的第一步。從臨牀驗證到監管批准，還有很多困難需要征服。但我們已經起了一個非常有希望的開頭，我們希望通過分享我們的工作，能夠加快在這個領域的進步。

via Assisting Pathologists in Detecting Cancer with Deep Learning，Google Research Blog，雷鋒網編譯

文章來源：雷鋒網

喜歡這篇文章嗎？快分享吧！