UCSB提出變分知識圖譜推理:在KG中引入變分推理框架

 2018-03-28 12:00:24.0

推理知識圖譜中缺失的連接已經吸引了研究界的廣泛關注。在本論文中,加州大學聖塔芭芭拉分校的王威廉等研究者在知識圖譜推理中引入了變分推理框架,並將路徑搜索和路徑推理緊密結合從而進行聯合推理,這種方法提升了知識圖譜推理模型的穩定性。

自動推理(Automated reasoning)作爲計算系統根據觀察到的證據做出新推論的一種能力,已經引起了很多研究團體的關注。近年來,人們對爲複雜推理任務設計機器學習算法的興趣一浪高過一浪,尤其在大型知識圖譜(KGs)方面,數不清的實體和連接讓傳統基於邏輯的算法面臨巨大挑戰。具體來說,我們將研究定位於這種大型知識圖譜多跳(multi-hop)推理的情境,目標是設計一個自動推理模型,以完善大型知識圖譜中現有實體間缺失的連接。例如,若知識圖譜中包含「總統」(貝拉克·奧巴馬,美國)及其配偶(米歇爾,貝拉克·奧巴馬)這兩個實體,我們要讓機器來自動完善隱藏其中的連接(米歇爾,美國)。實現該任務的系統在解答覆雜問題的應用中必不可少。

爲了處理多跳連接推測的問題,人們提出過各種各樣的方法。一些諸如 PRA(Path Ranking Algorithm,路徑排序算法)(Lao et al., 2011; Gardner et al., 2014, 2013) 的早期研究使用可重複啓動的有界深度(bounded-depth)隨機遊走來獲取路徑。最近 DeepPath (Xiong et al., 2017) 和 MINERVA (Das et al., 2017) 將路徑搜索問題設置爲一個馬爾可夫決策過程(MDP)並利用強化學習(RL)將預期的返回值最大化。與我們的工作同時進行的另一項工作是「推理鏈」(Chain-of-Reasoning,Das et al., 2016) 和複合推理 (Compositional Reasoning,Neelakantan et al., 2015) 的研究,即以 PRA 學習到的多跳鏈爲輸入來推斷其關係。

這裏我們將 KG 推理任務設置爲兩個子步驟,即「路徑搜索」和「路徑推理」。我們發現大多數相關研究只專注於其中一步,且其主要缺陷在於忽視了兩個步驟間的交互。更確切地說,DeepPath (Xiong et al., 2017) 和 MINERVA (Das et al., 2017) 可以被理解爲「路徑搜索」步驟的優化,而複合推理 (Neelakantan et al., 2015) 和推理鏈 (Das et al., 2016) 可被認爲是「路徑推理」這一步的優化。DeepPath 經訓練以用來使兩個給定實體間的路徑搜索更有效率,但無法得知實體對之間的聯繫存在與否;相對地,給定一對查詢實體,MINERVA 會學習到達目標節點,但又無法得知搜索路徑的質量。相比來說,推理鏈和複合推理僅僅是推斷給定關係的路徑,但無法得知路徑搜索程序的過程。缺乏交互使得模型無法理解更多樣化的輸入,而且對噪聲和對抗樣本非常敏感。

爲了提高現有 KG 推理模型的穩定性並處理更多有噪聲的環境,我們打算從潛變量圖模型的視角,將兩個步驟結合爲一個整體。這個圖模型在給定實體對的條件下將路徑視爲離散的潛變量,將關係看作顯變量,這樣路徑搜尋模塊可以被視爲使用先驗分佈來推斷 KG 中的底層連接。與之相對,路徑推理模塊可被視爲把底層連接劃分爲不同類別的似然分佈。在這一假設下,我們引入近似後驗,並設計了一個變分自編碼 (Kingma and Welling, 2013) 算法以最大化下界。這個變分架構將兩個模塊緊密結合爲統一的整體,並對其同時進行訓練。通過積極合作和交互,路徑搜索可以考慮到搜索到路徑的價值並使用更有意義的路徑。與此同時,路徑推理模塊會收到路徑搜索模塊傳來的多樣性路徑,從而更好地歸納未知的情境。我們的貢獻在於以下三點:

  • 在 KG 推理中引入了變分推理框架,將路徑搜索和路徑推理緊密結合從而進行聯合推理。

  • 成功地在訓練中加入反面樣本,同時提高了現有 KG 推理模型的穩定性。

  • 本文的模型可以擴展到大型 KG,並在兩項任務中得到最高水平的結果。

論文的其它部分結構如下:在第 2 部分我們將概述 KG 嵌入、多跳推理以及變分自編碼的相關研究;在第 3 部分描述我們的變分知識推理工具 DIVA;第 4 部分展示了試驗結果;第 5 部分爲結論。

圖 1:本文所提出的方法的概率圖模型。虛線框內的箭頭代表整個連接空間中以多項分佈建模的近似後驗。實線框內的箭頭代表先驗和似然分佈。

圖 2:CNN 路徑推理機概覽。

圖 3:路徑搜索模型概覽。注意,在近似後驗中存在 r_q 而在路徑搜索模型中不存在 r_q

表 2:基於 NELL 數據集的 MAP 結果。鑑於 MINERVA (Das et al., 2017) 只取用了 12 個初始關係中的 9 個,我們在此展示了 NELL-995 數據集兩個版本的結果。

表 3:基於 FB15k 數據集的結果,請注意,MINERVA 的結果是由我們實現獲取的。

圖 5:NELL 和 FB15k 連接推理任務的誤差分析。由於 FB15k 數據集將佔位符也作爲實體,我們無法分析出誤差是否來源於 KG 的噪聲。

論文:變分知識圖譜推理

論文鏈接:https://arxiv.org/abs/1803.06581

推理知識圖譜中缺失的連接已經吸引了研究界的廣泛關注。在本文中,我們處理了一類包含推理給定實體對間關係的實際查詢任務。我們將這類問題設計爲一個概率圖模型下的推理問題並試圖從變分推理的視角解決它。爲了建立查詢實體對的關係模型,我們假設 KG 中存在潛變量(所有連接這兩個節點的路徑集合),即它們之間的聯繫。但由於大型 KG 內的關聯問題難以解決,我們提出用變分推理來使 ELBO 最大化。更確切地說,我們的框架(DIVA)由三個模塊組成——後驗近似、先驗(路徑搜索)以及似然估計(路徑推理)。通過變分推理方法,我們成功將三者緊密結合爲一個統一的架構,同時對其聯合優化以實現 KG 推理。隨着伴隨子模塊間的積極交互,DIVA 可以更好地處理噪聲並應付更復雜的推理情境。爲評估我們的方法,我們基於 NELL-995 和 FB15k 數據集執行了連接推理任務試驗,而在兩個數據集下的表現都達到了很高的水準。

文章來源:機器之心