業界 | 閱面科技發佈堪比服務器的終端視覺模塊,將雲端計算能力搬至終端

 2017-11-05 13:13:00.0

原標題:業界 | 閱面科技發佈堪比服務器的終端視覺模塊,將雲端計算能力搬至終端

機器之心原創

作者:王藝 藤子

這家蟄伏了兩年的終端視覺公司,在首次發佈會後兩天的時間內,收穫了一百餘份訂單,是怎樣的新品讓產業如此興奮?

11 月 1 日,閱面科技在深圳舉辦了創立兩年來的首次新品發佈會,共發佈了三款產品:跨模態人臉識別引擎 UniFace、基於 Uniface 的「繁星」AI 芯片視覺模塊、以及基於「繁星」的智能客羣分析攝像機——「閱客」。

在發佈會後,閱面科技創始人兼 CEO 趙京雷對機器之能透露道,發佈會後兩天時間內,他們就收穫了一百餘份訂單,此時的趙京雷內心難掩興奮之情。

十多年前,趙京雷從上海交通大學博士畢業後,進入 WiseNut 從事搜索引擎和機器學習產品的研發。後來,他加入阿里巴巴,帶領一支包括自然語言處理和計算機視覺技術在內的算法團隊,產品涉及搜索廣告推薦、圖像搜索、圖像過濾等。

2013 年,趙京雷創立了虛擬試衣應用「上街吧」,這是一款集自然語言搜索、虛擬試衣、服裝搭配、精準購買爲一體的手機 App,通過推薦和搜索技術,以圖像處理技術爲基礎,幫助女性穿衣搭配並完成線上購買。

2015 年,網絡上圖片、視頻數據大量涌現,道路上以及公共場所中的攝像頭也非常普及。然而,趙京雷觀察到,這些設備並不智能,或者說當時的智能是「僞智能」。因爲當時圖像信息被採集出來之後,放到服務器端或者雲端進行批處理,處理的目的僅僅侷限在圖像搜索層面。

趙京雷判斷,基於計算機視覺技術,讓終端設備擁有真正的實時智能化的能力,在未來將有很大的爆發潛力。與此同時,移動端應用市場開始疲軟。因此趙京雷放棄「上街吧」,於 2015 年 7 月創立閱面科技,專注於深度學習和計算機視覺,提供嵌入式視覺方案。

人臉識別技術:關鍵在跨平臺、跨場景、跨領域

作爲計算機視覺的重要分支,趙京雷決定從人臉識別入手。「人臉識別的意義在於,它會成爲一個新的、統一的、唯一的 ID,它會改造大量智能設備,人們無論是進出某個地方,還是登錄或認證,都會基於這個 ID 去實現。」趙京雷說。

基於面部識別的情感認知引擎 ReadFace 是閱面科技推出的首個產品,從 ReadFace 的情感認知技術開始,閱面的技術一步步覆蓋性別、年齡等屬性的辨識,逐步發展爲如今的跨模態人臉識別引擎 UniFace。趙京雷認爲,在迭代研發的過程中,閱面科技走過了多個階段。首先是底層技術,要支持人臉各種各樣的基礎屬性,然後纔是識別技術。

在識別技術方面,閱面科技多次在各個國際評測中獲得優秀成績,比如在 2017 年 5 月,人臉檢測平臺 FDDB 的數據顯示,閱面科技的技術已處於行業領先水平,在接下來的 6 月,閱面科技人臉識別技術以 99.82% 的識別精度獲得了 LFW 冠軍。但趙京雷認爲,人臉識別不能止步於識別技術,人臉識別要走向實際應用,需要跨平臺、跨領域、跨場景。

「LFW 是一個較爲標準的場景,在 LFW 上面達到非常高的水準,只能說明底層算法能力、算法團隊很強,(閱面在)這點毋庸置疑。但是,從算法到應用,從標準場景到實際場景,人臉的特質會發生改變。」趙京雷說。

比如,在無人零售的應用場景中,攝像機對顧客進行人臉識別時,顧客通常情況下,並非正面對視攝像頭,大多數人是以低頭或歪頭的狀態,通過不同角度進入攝像機的範圍。

即使在人物正視攝像頭的應用場景,也會存在挑戰。比如在人證覈查,也就是將身份證照片和人臉進行對比的場景下,就存在年齡跨度的問題。若要對幼兒園的兒童進行識別,底層數據或架構也和通用的識別模式不同。

趙京雷認爲,通用的模型已將精度解決到一定的程度,當特定領域,比如幼兒園的兒童識別,以及無人零售中的人臉識別,精度需要更高水準。因此,通用模型需要具備在小數據下遷移學習的能力,快速適應其他領域,讓人臉識別技術滿足特定場景的精度需求。

「底層的模型都是基於千萬規模的數據構建的,但在一個小的領域,樣本數據可能就很少。如何把這個模型的能力完整遷移過去,是我們研究的一個重點。」趙京雷說。

據趙京雷介紹,閱面科技在發佈會上推出的跨模態人臉識別引擎 UniFace,擁有跨模態與遷移學習能力,與目前主流算法不同的是,UniFace 打破了不同傳感器、不同環境、不同場景、不同領域人臉特徵表達的限制,例如同一張註冊照片能在可見光、紅外、3D 三種不同的傳感器中進行識別,做到以 FaceID 爲連通的人臉識別體系。

「我們的算法既可以在服務器上跑,也能在終端的 DSP、VPU 等專用芯片上跑,還能在 ARM Coretx-A7 甚至 A5 等通用 CPU 內核上跑。」趙京雷進一步介紹。

閱面科技在嵌入式優化上有很深的積累,比如在 LFW 上,UniFace 的精度在 16bit 網絡上爲 99.82%,8bit 網絡爲 99% 以上,1bit 爲 95% 以上。他認爲,移動端模型的優化不能以損失模型精度爲前提,而在未來,要以 FaceID 打通人臉系統,移動端和雲端就要具有同樣的精度。

計算機視覺的三個爆發點:從人臉識別到數據採集再到人機交互

「人工智能落地到行業,一定需要入口,而這個入口一定是硬件,如同智能音箱是語音的入口。人臉識別作爲計算機視覺的應用,它的入口在哪裏?不是在遠程某個服務器的某個 API 上,而是在真正進入家庭、社區、滲入生活方方面面的硬件上。」趙京雷說。

這些硬件既可以是獨立的攝像頭,也可以是嵌入相機的設備或者其他設備。要實現人臉識別的廣泛應用,不能單靠雲端,因爲雲端的優勢在於提供基礎能力,所有的前端攝像頭都需要具備智能的感知和認知層。人工智能技術或計算機視覺技術,正在逐漸貼近生活,向着簡單便捷的方向發展是必然的趨勢。

「之前的算法更多地是來源於實驗室,部署在大型的計算中心、雲端,需要很大的計算能力、功耗,無法走進人們的日常生活。」趙京雷說,在這樣的情況下,首先要解決算法貼近生活領域時的精度問題,並讓高精度的算法以相對較低的成本、較低的功耗運行在貼近生活的設備上。

當各種設備具備視覺能力之後,所有的攝像頭將不再是影像採集設備,而成爲了數據採集的設備。很多數據採集手段將被視覺代替,攝像頭不僅是攝像機,會成爲傳感器。「室內定位等問題,或者統計客流使用的 wifi 探針技術等,在未來全部會被視覺代替,這將成爲計算機視覺未來很大的應用點和爆發點。」趙京雷說。

「這種智能會帶來全新的人機交互方式,我們從成立開始就一直認爲以下三個點是未來最重要的應用爆發的三個點,人臉識別的需求在當下已經顯現,基於視覺數據的分析 1-2 年後會爆發,而 3-5 年後的增長點則是人機交互。」趙京雷分析道。

「繁星」終端視覺模塊

「繁星」AI 芯片視覺模塊系列正是基於這樣的邏輯推出,可搭載適用於不同場景的算法 IP。目前主要包括:繁星-人臉識別模塊、繁星-數據採集模塊、繁星-人機交互模塊。

繁星-人臉識別模塊,通過寬動態 Sensor 獲取圖像或視頻流,分析圖像或視頻流中的人臉圖像進行檢測和識別,輸出結構化數據,可同時追蹤和抓拍 30 人,抓取最清晰、角度最好的人臉,抓拍率 99%,誤檢率小於 0.5%,抓拍重複率低於 10%。同時,支持 2 萬人內的完全本地人臉識別。支持本地特徵提取後傳雲端,滿足大於 2 萬人的人臉識別場景。

繁星-數據採集模塊,獲取並分析圖像或視頻流中的人頭和人臉信息,進行人數、人羣屬性以及軌跡分析。可實時記錄 15 人運動軌跡及運動方向,可進行進出指定區域的人數統計,準確率達 95%。

繁星-人機交互模塊,檢測識別圖像或視頻流中的手勢、人臉、人體,並轉化爲指令使得機器做出正確響應。能夠達到毫秒級檢測及追蹤速度,支持掌、拳、V 字手型、伸掌、握拳、揮手等多種手勢操控,具有高魯棒性的人臉及人體檢測追蹤運算。

據閱面科技介紹,「繁星」AI 芯片視覺模塊尺寸爲 38mm×38mm×1.6mm,由 Sensor+ISP+VPU+嵌入式深度學習視覺算法組成,在本地集成了閱面科技的深度學習視覺處理算法,本地深度學習處理功耗僅爲 0.5W,整體高峯功耗小於 2.5W。

此外,「繁星」AI 芯片視覺模塊支持外接視頻輸入以及結構化數據的實時輸出,既可以作爲獨立 AI 攝像頭嵌入到各種設備中即插即用,也可以作爲視覺協處理器。例如,傳統攝像機加入「繁星」AI 芯片模塊,就能搖身一變,成爲一個擁有視覺算法能力的智能 AI 相機。而且攝像頭廠商在設計搭載「繁星」的攝像頭時,不需要重新設計模具。

推出滿足未來趨勢和潮流的產品

產品的推出,並非易事。「從成立到現在,很長一段時間,我們都在進行技術研發,不僅涉及算法,還涉及與硬件層的銜接、系統層的應用。我們花了很大的精力進行基礎研發,經過長時間積累,希望我們推出的產品能改變行業,增加行業產品迭代的效率或創新能力。」趙京雷說。

而爲了給下游攝像頭廠商吃顆定心丸,也爲了樹立「繁星」的使用樣板。閱面科技採用自身的「繁星」數據採集模塊研發了一款名爲「閱客」的智能客羣分析攝像機,並連接了閱面科技自身搭建的垂直行業雲,並配有手機 App,用戶能夠通過該 App 實時觀察到客羣分析情況。利用「繁星」的本地計算能力,閱客可以輕鬆進行實時客流計數、會員/熟客管理、軌跡管理等功能,商家能實時掌握顧客屬性和行爲。目前,「閱客」已和蘇寧、軟通動力、淘咖啡等品牌達成合作。

趙京雷認爲,UniFace、「繁星」、「閱客」這三款產品是層層遞進的關係,算法——基於算法的硬件——基於硬件的產品。通過這三款產品,閱面科技能將很大部分的視覺識別能力搬至終端;降低 AI 硬件的構建成本,降低技術的使用門檻;方便垂直行業快速開發場景化的智能視覺產品。這意味着,非 AI 技術的行業商家也能輕鬆開發和部署人臉識別產品和系統,以消費級的價格,做到專業安防級的能力(舉例來講,具備人臉抓拍功能的安防攝像頭成本是普通攝像頭的 3-5 倍,而使用「繁星」,可以將 AI 攝像頭的成本控制在與普通攝像頭相近的範圍)。

閱面科技成立於 2015 年,對於市場上的計算機視覺公司來說,並不算早。當前在計算機視覺市場上,也有不少的玩家。通常來說,一個新進入的公司要想在這個競爭格局中生存下來,差異化是重要的選擇。

然而,趙京雷卻表示,「對我們而言,公司發展重點不是差異化,而是思考這個領域產品形式的終極形態」,在趙京雷看來,他們對行業的認知、技術的出發點、產品的出發點、以及未來解決方案的出發點,都是基於對行業終極形態的思考構建的。「我們希望推出的產品能夠滿足未來的趨勢和潮流。如果其他公司與我們認知一致,那我們就比誰走得快;如果我們認爲的終極形態跟別人不一樣,也還是會根據自己的認知走下去。」趙京雷總結道。

本文爲機器之心原創,轉載請聯繫本公衆號獲得授權。

責任編輯:

文章來源:機器之心