Petuum新研究助力臨牀決策:使用深度學習預測出院用藥

 2017-12-05 08:53:00.0

原標題:學界 | Petuum新研究助力臨牀決策:使用深度學習預測出院用藥

Petuum 專欄

作者:Yuan Yang、Pengtao Xie、Xin Gao、Carol Cheng、Christy Li、Hongbao Zhang、Eric Xing

在過去一年中,我們看到了很多某種人工智能算法在某個醫療檢測任務中「超越」人類醫生的研究和報道,例如皮膚癌、肺炎診斷等。如何解讀這些結果?他們是否真正抓住醫療實踐中的痛點、解決醫生和病人的實際需要? 這些算法原型如何落地部署於數據高度複雜、碎片化、異質性嚴重且隱含錯誤的真實環境中?這些問題常常在很多「刷榜」工作中迴避了。事實上,從最近 IBM Watson 和美國頂級醫療中心 MD Anderson 合作失敗的例子可以看出,人工智能對醫療來說更應關注的任務應該是如何幫助醫生更好地工作(例如生成醫療圖像報告、推薦藥物等),而非理想化地着眼於取代醫生來做診斷,並且繞開這個終極目標(暫且不論這個目標本身是否可行或被接受)之前各種必須的鋪墊和基礎工作。因此與人類醫生做各種形式對比的出發點本身有悖嚴肅的科學和工程評測原則。這些不從實際應用場景出發的研究,甚至無限放大人機對戰,對人工智能研究者、醫療從業者和公衆都是誤導。

知名人工智能創業公司 Petuum 近期發表了幾篇論文,本着尊重醫療行業狀況和需求的研究思路,體現出了一種務實風格,並直接應用於他們的產品。爲更好地傳播人工智能與醫療結合的研究成果,同時爲人工智能研究者和醫療從業者帶來更加實用的參考,我們和 Petuum 將帶來系列論文介紹。本文是該系列第三篇,介紹了使用深度學習在就診時間預測出院用藥的方法。

隨着美國電子健康檔案(EHR)的普及以及醫療健康數據新來源的快速發展,一場醫療與健康數據的海嘯已經出現。隨着數據的數量增長和複雜度增加,醫療分析和決策正變得越來越耗時、易出錯、結果不理想。在各種臨牀決策中,制定理想的治療方案是至關重要並且很有難度的一個。即使在確診的前提下,醫生仍需要伴隨患者病程不斷優化治療方案。例如併發慢性心力衰竭和高血壓的慢性腎病患者,因心衰惡化入院,醫生則需要已經使用的抗高血壓藥物進行調整,比如改變利尿劑的種類和劑量等。因此對於新確診的病人,根據入院就診時得到的有限信息預測該病人在出院時的藥物治療方案對醫生來說是一件具有挑戰的事情。在入院時,醫生會了解病人的就診原因, 病史(包括共病情況, co-morbidities)等,進行相關實驗室或影像學檢查等並記錄在入院病歷中(admission note)。藉助先進的機器學習與深度學習技術,我們從上萬份的患者入院病歷記錄中提取關鍵信息,對出院用藥實現了更準確的預測。

精準的出院用藥預測能向醫生提供指導,幫助醫生及時發現用藥偏差(medication discrepancy)。用藥偏差是指在患者入院,轉院,出院過程中用藥方案在記錄過程中發生的非計劃性的改變。在美國 70% 的患者受到用藥偏差的影響,其中⅓可能對患者造成中度至重度的危害。爲了解決用藥偏差可能帶來的問題,藥物覈對(medication reconciliation)作爲一個保證患者治療安全的重要環節,要求醫生在患者入院及出院環節對藥物方案進行仔細覈實與比對。入院時對出院用藥的預測可以幫助醫生及時發現用藥偏差,避免由於藥物重複或遺漏可能造成的病人安全風險問題,同時這種預測可以作爲一種有效的早期預警工具幫助醫生儘早監控管理藥物的處方,並及時減少不必要的用藥疏失(medication error)。

在利用深度學習方法在入院就診時間對出院藥物進行預測的過程中,主要有有兩方面的困難。首先,可用的就診信息大多數都是非結構化的病歷記錄(稱爲入院記錄),比如既往病史、家族史、過敏等情況。與實驗室檢測數據和體徵數據等結構化信息相比,這些自由形式的文本更難被機器處理和理解。此外,這些記錄還包含了同義詞、縮寫和拼寫錯誤。因此,從這些非結構化且有噪聲的文本中有效提取語義模式是我們需要解決的第一個問題。其次,在臨牀上,爲了快速並有效的治癒疾病,達到治療目的,常常會使用兩種或兩種以上的藥物,許多聯合用藥的方案在臨牀治療指南或專家共識中被廣泛認可。例如,對已服用阿司匹林的中風病人,爲了有效預防再次中風的發生,醫生會推薦雙聯抗血小板治療(dual anti-platelet therapy),既同時服用阿司匹林和氯吡格雷。大量研究表明多重藥物的聯合治療對疾病的進展,預後及死亡事件的發生都有一定的影響。如何自動發現和利用藥物之間的這種相關性,對於更準確的多藥物預測是至關重要的,這也是非常有價值的。

論文:基於深度學習在就診時間預測出院用藥(Predicting Discharge Medications at Admission Time Based on Deep Learning)

論文鏈接:https://arxiv.org/abs/1711.01386

摘要:在病人入院就診時預測其出院用藥可以幫助醫生更好地計劃和核對用藥方案、發現用藥偏差、降低用藥安全風險。由於病人在住院期間病情進展不盡相同,僅利用就診時可用的有限信息對病人出院情況進行預測會較爲困難。本文研究瞭如何使用深度學習技術來協助醫生根據病人就診記錄中的健康信息來預測其出院用藥。在實現上,我們設計了一種卷積神經網絡來分析就診記錄然後預測病人在出院時的用藥。該模型可以從非結構化和有噪聲的文本中提取語義表徵,並能自動學習不同藥物之間的藥理相關性。我們在 2.5 萬份病人就診記錄上對該模型進行了評估,並與 4 種基準模型進行了比較。在宏平均 F1 分數上,該方法相對於最好的基準模型有 20% 的提升。

貢獻

本文提出了一種以電子健康檔案爲輸入,預測一種或多種出院用藥的卷積神經網絡(CNN)模型。該模型可以從原始文本中學習到豐富的語義表徵,並且可以自動獲得藥物之間的相關性。我們在 2.5 萬份病人就診記錄上對抗高血壓藥這一特定藥物類別上對該模型進行了評估。在平均 macro F1 分數上,我們的方法比最好的基準好 20%。

方法

研究設計

我們在之前收集到的重症監護病房(ICU)病人的電子健康檔案進行了回顧性研究(retrospective study),根據就診記錄構建了一個預測出院用藥的深度學習模型。我們對比了該模型和其他四個基準模型所預測的藥物與醫生給出的藥物的區別,從而評估了模型的性能。

數據預處理

該研究使用了 MIMIC-III 數據集並且重點關注了其中出現的 8 種抗高血壓藥:美託洛爾(metoprolol)、呋塞米(furosemide)、賴諾普利(lisinopril)、氨氯地平(amlodipine)、阿替洛爾(atenolol)、氫氯噻嗪(hydrochlorothiazide)、地爾硫卓(diltiazem)、卡維地洛(carvedilol)。

圖 1:8 種抗高血壓藥物在 MIMIC-III 數據集中的頻率,Hctz 是氫氯噻嗪的簡寫

表 1:左欄顯示 8 種就診時可用的信息類型,右欄每行顯示了 MIMIC-III 中對應的提取此類信息的標題字符串

模型設計

我們開發了一個可基於就診時可用的信息來預測出院用藥的深度學習模型。該模型的輸入爲就診記錄,輸出是病人的出院用藥(一種或多種)。該模型具備兩種功能:1)能有效地從有噪聲的和非結構化的原始文本中提取高層次的語義並能適當地考慮連續詞彙之間的序列結構;2)其次,該模型能學習不同藥物之間的藥理相關性。

爲了同時實現這兩個目標,我們開發了一種基於卷積神經網絡(CNN)的模型。從高層面看,該模型:1)使用了多個堆疊的隱藏單元層來獲取輸入記錄的隱含語義;2) 使用了不同窗口大小的卷積算子來獲取 n-gram 中存在的局部語義和序列結構;3) 可發現常見的隱含因子,從而學習得到藥物之間的藥理相關性。

圖 2:CNN 模型的網絡架構

結果

從宏平均和微平均兩種 F1 分數上來看,CNN 有遠高於其他所有基準模型的準確率。在兩種平均 F1 分數之間,CNN 在宏平均上的提升更爲顯著。CNN 在 7 種藥物上都得到了最好的 F1 分數。呋塞米是唯一的例外,其中隨機森林(RF)的表現優於 CNN。CNN 相對於基準的提升主要體現在召回率(recall)上,而其準確率則與基準模型相當。在各類基準模型中,只使用就診藥物作爲輸入的 多層感知機(MLP)在宏平均和微平均 F1 上的表現最差;另外,非線性支撐向量機(SVM)和 RF 的表現優於線性的邏輯迴歸模型(LR)。

CNN 相較於其它基準較高的得分來源於它的分層的隱藏層結構。這樣的結構使得 CNN 能在多種粒度(單詞層面、短語層面和文本層面)上提取相關的語義信息。

表 2:CNN 和 4 個基準模型在 5 次實驗中對每一類藥物的準確率(P)、召回率(R)和 F1 的平均分數。藥物從上到下按照頻率降序排列。模型整體的分數分別通過以上所有分數的宏平均(Macro Avg)和微平均(Micro Avg)得到。

表 3:在單詞嵌入空間中一些詞(Query)和它在空間中的最近鄰(NN)。兩個詞之間的「相似程度」對應它們的嵌入向量之間的歐式距離。

擴展閱讀:

    文章來源:機器之心