3D視覺機遇在前,安卓陣營的應用突圍

 2018-08-11 09:01:45.0

智能手機已經進入到第十一個年頭,市場不再滿足於「喬布斯後」時代的iPhone創新。與此同時,以國產手機品牌爲代表的安卓陣營開始登上世界級舞臺,並在不斷分化與成長中縮短與蘋果之間的距離。

一年前,iPhone X發佈,3D視覺技術首次在消費級市場中普及開來。一年間,華爲、OPPO、小米等一線國產手機品牌相繼完成了從2D到2.5D,以及3D的進階和追趕。

據Sigmaintell調查,2018年全球支持3D深度攝像的手機出貨量預計將達到1.03億部;到2019年將達到2.5億部,安卓手機出貨量將大幅提升。

但是,量產並不意味着最終勝利。

提起谷歌早年Project Tango項目的失利——應用生態的短板足以爲所有人敲上警鐘。伴隨技術而生長出的應用和內容生態纔是技術繁榮的關鍵,殺手級應用成爲安卓陣營裏翹首以盼的希望。

這一次,把發言權留給技術和生態背後的推手們。

 最大難題 

「如果安卓系統的 Camera API 還停留在支持 2D 的時代,硬件廠商要做 3D 有多難?」3D 解決方案創業公司 Bellus3D 聯合創始人兼 CEO Eric Chen 說道。

Bellus3D 聯合創始人兼CEO Eric Chen

Bellus3D創建於2015年,主要爲手機等移動設備提供高解析度的3D人臉掃描、建模技術和產品。目前,Bellus 3D的3D建模方案主要提供三種實現方式,包括外接式攝像頭、手機應用軟件、雙目結構光。

在機器之心接觸到諸多3D視覺方案推動者中,不少人也發出了同樣的感慨。

安卓系統的底層API源自於谷歌,開發者基於開源的API來開發應用,但在3D視覺技術升級這件事上,谷歌似乎偏向於保守。

iPhone X的3D結構光視覺技術已經落地將近一年,但安卓系統對於3D視覺技術的多個接口仍未開放。這爲安卓陣營樹下了一大難題——缺少統一的開發環境。

然而,難題並不是第一次遇到。

經過多年的分化和發展,如今每一家主流安卓品牌廠商都已經改良出一套適應於自家的安卓開發環境,對於開發者而言,即面對每一個不同的手機API。

「在蘋果開發應用,只要適配於 AR Kit;但在安卓,OPPO 有自己的AR 開發環境,小米、華爲等品牌手機的開發環境都不一樣,手機性能也有很大差異。開發者很難適應。三維軟件所運行的環境也千差萬別,這是阻礙生態發展的最大問題。」

在Eric 看來,移動端的3D視覺是一項新興技術,如果缺少統一的行業標準,生態很難建立。「短期內一定要解決。」

有開發者向機器之心表示,由於技術上線節奏過快,部分安卓手機廠商來不及開發基於3D攝像頭的API,所以可能採取自己創建應用,或是和支持應用合作的模式,比如和電子支付應用支付寶合作。

作爲3D視覺技術的老兵,Eric 認爲,當下3D技術的市場環境和二三十年前已經有很大的不同。三十年前加入蘋果,Eric曾是蘋果公司 Quicktime VR 項目的創建者之一,手頭擁有16項美國專利。

Eric回憶,1995年時他成爲蘋果最早一代研發3D技術的成員,受限於硬件技術的限制,主要採用全景方式實現。他表示,當下的3D硬件和技術門檻已經大幅降低,以前開發一個3D的環境非常困難,需要特殊的技術、特殊的人才,但現在面臨的最大問題是應用的落地。

艾邁斯半導體大中華區銷售和市場副總裁陳平路

談到3D硬件市場情況,艾邁斯半導體大中華區銷售和市場副總裁陳平路表示,如今硬件技術已經突破,但手機市場對於成本十分敏感,如何在低成本下實現3D技術是技術普及的挑戰之一。

艾邁斯半導體(AMS)總部位於奧地利,主要提供晶圓級光學元器件和衍射光學元件,並採用高度微型化的光學封裝,涉及光學傳感、圖像傳感、環境、音頻等四大產品線。

疊境數字科技CEO洪煦

「iPhone X 的 3D 視覺落地以後,曾有數家 3D 硬件模組廠商主動找到我詢問應用的事」,疊境數字科技CEO洪煦說道,硬件方表達過他們的擔憂:硬件規格會進一步提升,投入增大,但落地之後的真正應用在哪裏?

「如果後續缺少應用生態的支持,前期的增量可能會迅速落空。」

疊境數字科技是一家上海的技術創業公司,基於光場技術研發虛擬現實、增強現實、3D成像等多個領域的應用。光場技術最典型的代表性技術公司就是Magic Leap,在VR、AR領域具有潛力應用價值。此前,疊境曾參與阿里「造物神」計劃,聯合商家建立3D商品庫。

反向驅動

相較於蘋果的閉源生態,安卓陣營的確過於分化和分散。

「但開放也是安卓的最大優勢,蘋果相對封閉,並把封閉的優勢發揮到最大。安卓一樣可以發揮出開放的威力。」曠視科技(Face++)高級副總裁吳文昊談道。

曠視科技(Face++)高級副總裁吳文昊

借鑑Linux和Windows不同模式的發展路徑,Linux從技術落後的平臺通過開放、共享,最終與Window相對閉源的生態共同成長,「這正是安卓開發者需要做的。」

吳文昊介紹,曠視從一年前開始切入手機市場,現已成爲華爲、OPPO、vivo、小米等主流手機廠商的重要合作伙伴,針對移動終端已經建立起識別與感知、計算攝影、3D視覺三大類應用解決方案。

計算攝影,是一個與圖像攝影相對的概念,通過拓展傳統圖像攝影中的某個或多個因素的維度來成像的方法。

圖像攝影是在硬件設計固定的情況下,進行信號跟圖像的處理,主要由軟件和算法進行控制。相對而言,計算攝影則是通過以優化軟件和算法的目的反向去驅動硬件的設計,包括光學系統的設計、傳感器設計等。

曠視的優勢在於應用層的算法。基於計算攝影學同樣的邏輯,曠視希望通過從FaceID等應用層去推動3D硬件層面的設計,比如結構光的精度等核心問題。

「用 AI Define Camera,這是曠視想做的事。」吳文昊談道。

Face++ 移動端3D產品矩陣

爲此,曠視基於OPPO Find X等實戰經驗,整合3D視覺產業鏈上下游資源,推出「軟硬一體」的移動端3D感知解決方案,包括算法創新、應用開發、設備製造到解決方案四個層面。在AI+3D的底層算法研發方面上,曠視專注於識別和重建兩大類。

據介紹,曠視目前在人像3D建模、人體3D建模及物體幾何測量算法研發方向已處於領先地位,並與Bellus 3D、Altizure等3D視覺企業開展了聯合研發合作。

在交流中,吳文昊多次強調垂直整合和應用驅動的概念。他表示,3D和AR落地一樣,需要殺手級應用推動,而Face ID將有潛力成爲領先者。

對於應用方而言,珠科創新(Altizure.cn)面對缺少統一API的開發環境,則採取雲端API調用的模式應對。

珠科創新由香港科技大學教授權龍創辦,旗下設有從生成實景三維影像到內容聚合、工業應用的閉環平臺Altizure.cn。平臺主要通過計算機視覺技術來識別圖片中的信息,加以人工智能以及深度學習技術來實現二維圖像到三維模型的建立工作。

珠科創新CEO方天向機器之心介紹,在硬件和手機上運行的API通常追求更高的時效性,必然會犧牲掉精度。珠科創新所提供的雲端API則更偏重於高精度的三維建模,同時也需要犧牲一定的實時性。

「這是對於硬件平臺和使用場景一種平衡。」方天說道。

此外,珠科創新正在嘗試建立內容的生態,通過早期專業用戶,比如攝影師、編導等生成優質內容,吸引普通大衆去享受和消費。

談到3D應用普及的標誌和生態建立的前提,方天表示,「有一天,在朋友圈能看到分享的三維影像內容,或許就是時候到了。」

Bellus3D則試圖從B端客戶中尋找市場空間。

Eric向我們展示了一款爲一家意大利眼鏡公司提供的BtoC應用。利用3D人臉掃描和建模後建立的用戶瞳孔距離信息,替代用戶去實體眼鏡店測量的過程,從而實現在線配眼鏡。

新iPhone和趨勢路透

不可否認,在應用趨勢和生態建立方面,蘋果仍然是諸多安卓廠商無法避開的參考座標。

「新代 iPhone 針對 3D 結構光的視覺方案可能不會出現太大升級,但該技術在應用和場景層面在延展和新玩法將爲安卓市場提供重要參考。」AMS 的大中華區銷售和市場副總裁陳平路向機器之心表示。

去年,AMS的核心DOE核心元件被用於iPhone X 中。此後,AMS通過收購戰略再佈局VCSEL(垂直腔面發射激光器)和麪部識別算法等多項技術。

據國際電子商情網,AMS的光源發射VCSEL技術有望應用於新款蘋果手機中。陳平路向機器之心確認了該消息。

除已經落地在iPhone X、OPPO Find X等機型中的3D結構光技術外,TOF(Time Of Flight 飛行時間)和雙目成像也是移動端3D成像的主要技術方式。

有分析表示,從數據來看,目前主要是以3D結構光方案爲主;但從供應鏈成熟度及相關專利考量,預計TOF的增長速度將成爲明年的發力重點。

採用TOF方案的微軟Kinect 2代

Eric 預計,後置的TOF方案將可能應用到主流手機廠商中,可能包括新一代iPhone和華爲Mate。因爲TOF適用於遠距識別、抗干擾性強等特點,在AR功能性應用和娛樂應用中將發揮重要作用,比如3D房屋建模和設計等。

從移動端的落地場景來看,3D技術大致可分爲兩個方向——前置和後置。

在未來三年內,前置3D技術和應用將會成長非常迅速,Eric Chen認爲,而相對來說,後置3D則會慢一些。因爲前置3D技術挑戰較小,使用場景也更爲明確。前置的對向物體離使用者距離更近,拍照和掃描的環境容易控制。

談到 3D 技術後續的發展趨勢,Eric 認可上升的方向,但他同時表示,「要真正產生出應用生態,不能光靠解鎖,前期被追捧可能是因爲廠商試水、用戶好奇,但新鮮感過去後,高速增長很難靠解鎖繼續維持。」

畢竟,指紋、虹膜、密碼都能夠進行解鎖,人臉解鎖並不是不可取代的方式。而引爆的關鍵,就在於找到一種人臉解鎖具備不可替代的應用場景。

談到手機發展趨勢的判斷,陳平路表示,在AI時代,人需要解放的是雙手,或者通過手機,或者通過眼鏡等穿戴式設備,這在技術層面可實現,但挑戰將集中在硬件上。

他強調,從傳感器和處理器層面來看,多個傳感器的小型封裝化、集成化、系統化的道路沒有盡頭。

多年後回望歷史,我們或許會發現,iPhone X和3D視覺的出現將成爲一個分界點——在這之後,曾經的蘋果追隨者們憑藉深厚的技術實力底氣嘗試向蘋果發出挑戰,朝着更具差異化的方向生長。

文章來源:機器之心