騰訊AI Lab提出Face R-FCN與Face CNN,刷新人臉檢測與識別兩大測評記錄

 2017-12-20 13:45:00.0

原標題:業界 | 騰訊AI Lab提出Face R-FCN與Face CNN,刷新人臉檢測與識別兩大測評記錄

騰訊 AI Lab 在大型人臉檢測平臺 WIDER FACE 與人臉識別平臺 MegaFace 的多項評測指標中榮膺榜首,刷新行業紀錄。此外,騰訊 AI Lab 已通過 arXiv 平臺發表論文公開部分技術細節。

人臉檢測是讓機器找到圖像視頻中所有人臉並精準定位其位置信息,人臉識別是基於人臉圖像自動辨識其身份,兩者密切相關,前者是後者的前提和基礎。在研究上,由於視角、光照、遮擋、姿態、年齡變化等複雜因素的干擾與影響,真實場景下的人臉檢測與識別問題一直是一個極具研究價值與挑戰性的國際性難題。而在應用上,其在政務、金融、安防等領域都具有極高價值。在人臉技術發展過程中,標準評測數據集的重要性不言而喻。參與標準數據集測試時,研究人員可在固定標準下,評估算法性能,並以此爲方向推動技術不斷髮展。

此次,騰訊 AI Lab 分別在大型人臉檢測平臺 WIDER FACE 與人臉識別平臺 MegaFace 的多項評測指標中榮膺榜首,刷新行業紀錄。針對人臉檢測與人臉識別,騰訊 AI Lab 分別推出了 Face R-FCN 算法與 Face CNN 算法。

騰訊 AI Lab 表示,該人臉技術已接入騰訊若干業務場景,每日技術調用量已超過 6 億次。一個典型的應用場景是在互聯網+公衆服務領域,通過人臉驗證完成身份自動鑑別的「刷臉辦事」場景,方便百姓遠程辦事。

以下是對這兩種算法的簡要介紹。

人臉檢測算法 Face R-FCN

WIDER FACE 目前是人臉檢測領域最大、最具挑戰性的人臉檢測評測平臺之一,由香港中文大學發佈維護,共有 3.2 萬張圖像,39 萬個標註的人臉,這些人臉具有很大程度的尺寸、姿態、角度和遮擋等變化,吸引了中科院、美國卡耐基梅隆大學和馬里蘭大學等知名機構參與測評。

據介紹,騰訊 AI Lab 針對人臉在尺度、光線、遮擋和角度等多維變化,有效改進深度全卷積神經網絡,提升人臉檢測精度和魯棒性,推出人臉檢測算法 Face R-FCN。該算法在 WIDER FACE 測試平臺中使用官方指定訓練集,即在完全公平競爭情況下評測不同參賽算法的性能時,在簡單、中等及困難模式(Easy、Medium、Hard)的全部三個測試子集中均取得世界第一。

WIDER FACE 人臉圖像示例,綠框是騰訊 AI Lab 算法檢測結果,紅框爲官方標註結果

WIDER FACE 評測結果曲線,第一行爲驗證集結果,第二行爲測試集結果:http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/WiderFace_Results.html

目前,介紹 Face R-FCN 算法部分技術細節的相關論文《Detecting Faces Using Region-based Fully Convolutional Networks》已經公佈到 arXiv。

論文介紹到,Face R-FCN 主要是基於代季峯等人 NIPS 2016 論文中提出的 R-FCN,但 Face R-FCN 相比於後者更加準確、計算更高效。在 Face R-FCN 中,騰訊採用 ResNet 作爲支柱網絡,特別是騰訊採用了包括位置敏感平均池化、多尺度訓練和測試、Online Hard Example Mining 等技術極大的改進了檢測準確率。

基於 R-FCN 框架的 Face R-FCN 算法的綜述。注意,裏面用敏感位置平均池化技術取代了全局平均池化做最終的特徵票決。

人臉識別算法 Face CNN

在人臉識別領域,MegaFace 是目前最權威熱門的人臉識別評測平臺之一,由美國華盛頓大學(University of Washington)發佈維護,在百萬規模人臉數據下,評定 1:N 辨識(Face Identification)和 1:1 驗證(Face Verification)兩大指標準確率。前者是在 N 個人數據庫中找到 1 個目標人臉,後者是判斷給定的兩張人臉是否屬於同一身份。基於評測數據規模多個評測指標上的優勢,MegaFace 吸引了 Google、俄羅斯著名安防公司 Vocord、日本 NEC 和美國卡耐基梅隆大學等知名機構參與。

MegaFace 常規人臉數據樣例

MegaFace 跨年齡人臉數據樣例,是同一個人在不同年齡時拍攝的照片

騰訊 AI Lab 針對常規人臉識別和跨年齡人臉識別,在網絡模型結構、特徵學習等方面創新性改進,推出了人臉識別算法 Face CNN。該算法在 MegaFace 測試平臺中使用官方指定訓練數據,即在完全公平競爭情況下評測不同參賽算法的性能時,在 MegaFace Challenge 2(簡稱爲 MF2)的所有測試任務均取得世界第一。MegaFace 含兩個挑戰,Challenge 1(MF1)可使用任何外部不限量的人臉數據來訓練參賽算法,如谷歌使用億級數據,其他團隊採用百萬級數據,因此較難公平比較算法性能。Challenge 2(MF2)使用官方固定訓練集,能更客觀對比各算法情況。MF2 分爲常規識別和跨年齡識別兩個子任務,分別使用 FaceScrub 和 FGNET 測試集,將 1:N 辨識和 1:1 驗證的準確率視爲兩項關鍵評測指標。

騰訊 AI Lab 表示,Face CNN 算法的相關技術解讀目前還未公開,但將在未來陸續公佈。

表 1. MF2 常規識別任務的辨識準確率(1:N)排名

表 2. MF2 的常規識別任務的驗證準確率(1:1)排名

表 3. MF2 的跨年齡識別任務的辨識準確率(1:N)排名

表 4. MF2 的跨年齡任務的驗證準確率(1:1)排名


文章來源:機器之心