中國中科院NIPS 2017論文提出深度離散哈希算法，可用於圖像檢索

2017-11-02 15:24:00.0

選自arXiv

中國科學院提出了一種深度離散哈希算法（discrete hashing algorithm），該算法認爲學習到的二值編碼應該也可以用於分類。實驗結果表明該方法在基準數據集上的表現要好過目前最好的哈希方法。

圖 1 深度離散哈希編碼示意圖

由於網絡上的圖像和視頻數據的快速增長，哈希算法（Hashing）在近幾年間引起了極大的關注。由於其較低的計算成本和較高的存儲效率，是圖像搜索和視頻搜索中最常使用的技術之一。一般來說，哈希算法可將高維數據編碼爲一組二進制代碼，與此同時還能保持圖像或視頻的相似性。現有哈希算法可以大致分爲兩類：數據無關的方法和數據有關的方法。

近期有人提出了基於深度學習的哈希算法，它可以同時學習圖像表示和哈希編碼（hash coding），取得了比傳統哈希算法更好的結果。「CNNH」[19] 是早期將深層神經網絡與哈希編碼融合的工作之一，該工作包括兩個階段來學習圖像特徵表示和哈希編碼。CNNH 的一個缺點是通過學習得到的圖像特徵表示不能及時反饋給哈希編碼。爲了克服 CNNH 的這一缺陷，「Network In Network Hashing/NINH」[8] 提出了基於三元組損失函數來表示圖像的相似性。研究表明，圖像特徵表示和哈希編碼可以在一個框架內相互促進。DSRH 算法 [24] 通過保留多標籤圖像間的相似語義信息來學習哈希函數。近年來還提出了其他基於排序的深度哈希算法 [17,21]。除了基於三元組排序方法外，還有一些基於成對標籤的深度哈希算法 [9,25]。

我們所做工作總結如下。「1」我們方法的最後一層輸出直接限制爲二進制編碼。學習到的二進制編碼既能保持圖像之間的相似關係，同時又能和標籤信息保持一致。據我們所知，該方法是第一個在統一框架下同時使用成對標籤信息和分類信息學習哈希編碼的方法。「2」爲了減少量化誤差，我們在優化過程中保留了哈希編碼的離散化這一特性。此外，我們還提出了一種交替優化方法，即使用座標下降法優化目標函數。「3」大量的實驗結果表明，我們的方法在圖像檢索問題上，取得了比現最好方法更好的結果，從而驗證了我們方法的有效性。

圖 1：DSDH-A、DSDH-B、DSDH-C 和 DSDH 在 CIFAR-10 上得到的結果：「a」Hamming 半徑爲 2 的精度曲線;「b」不同數目最佳返回圖像的精度曲線（不確定）;「c」具有 48 位哈希編碼的精度-召回曲線。

表 1：第一組實驗設置下不同方法的 MAP。NUS-WIDE 數據集的 MAP 是根據返回的前 5，000 位鄰近值計算的。DPSH * 表示重新運行 DPSH 作者提供的代碼。

表 2：第二組實驗設置下不同方法的 MAP。NUS-WIDE 數據集的 MAP 是根據返回的前 50，000 位鄰近值計算的。DPSH * 表示重新運行 DPSH 作者提供的代碼。

表 3：第一組實驗設置下不同方法的 MAP。NUS-WIDE 數據集的 MAP 是根據返回的前 5，000 位鄰近值計算的。

論文：Deep supervised discrete hashing

論文地址：https://arxiv.org/abs/1705.10999

摘要：隨着網絡上圖像和視頻數據的快速發展，近幾年圖像及視頻檢索也被廣泛的研究。得益於深度學習的發展，深度哈希方法在圖像檢索方面也取得了一定的成果。然而，之前的深度哈希方法還是存在一些限制「例如，沒有充分利用語義信息」。在本文中，我們提出了一種深度離散哈希算法（discrete hashing algorithm），該算法認爲學習到的二值編碼應該也可以用於分類。成對標籤信息和分類信息在統一框架下用於學習哈希編碼。我們將最後一層的輸出直接限制爲二進制編碼，而這種做法在基於深度學習哈希算法中很少被研究。由於哈希編碼的離散性質，我們使用交替優化方法來求解目標函數。實驗結果表明，我們的方法在基準數據集上的表現要好過目前最好的哈希方法。

文章來源：機器之心

喜歡這篇文章嗎？快分享吧！