專訪美圖 CTO 張偉:5年以前,我們也不會想到會花 70% 的時間在人工智能上

 2017-05-10 22:33:00.0

視覺文化時代,「顏值」作爲生活之美的展示,被覽閱和品味,不僅成爲一種文化符號,更成爲一種可以被消費和增值的商品。

美圖做的就是「顏值」這門生意。

在國內,或許沒有哪家公司能比美圖更能精準把握人們對於「顏值」的需求。單是圍繞這一點,美圖就分步有序地打造了 20 多個美顏類 app,以及爲自拍功能定製的手機。在初期一片唱衰和嘲諷中,手機已然成爲美圖營收主要的貢獻者,2016 年近 75 萬臺的銷量,爲美圖提供了 14.7 億的收入。

如果你走在商業街裏,推開一家傢俬營服裝店,會發現這些店主們十有八九,用的都是美圖標誌性的盾牌形狀手機。

新花樣:視頻實時分割

「美」總是需要新花樣的。膚白長腿大眼遠遠不夠,還更需要有趣的內容和形式。而這種「花樣」需要繁複的基礎技術作爲支撐。

對於目前最火熱的人工智能技術,美圖自然也看到了它背後蘊含的顛覆性力量。

在美拍平臺上,明星柳巖所拍攝的美少女變身視頻,已經擁有接近 200 萬的播放量,裏面所展現的「百變背景」功能,可以在視頻中進行實時圖像分割,將人物從真實場景中摳出,放置在特定的卡通背景中,並加入 AR 特效和音樂效果。

專訪美圖 CTO 張偉:5年以前,我們也不會想到會花 70% 的時間在人工智能上

這項技術的實現,用了深度學習。

在 CV 圈,圖像分割技術並不新鮮。對於一張靜態的圖片進行分割,可以花費很長時間來處理,但是「實時」則要求達到每秒 30 幀的處理速度。在這極短的時間內需要進行的工作包括:人像識別和分割、邊緣處理、背景替換、實時美顏美型、AR 效果添加等多個環節。

保證視頻實時分割的響應性、速度和可靠性,綜合考驗了一家公司技術團隊的研發和工程能力。

在 AI 領域的發聲

作爲一家 2C 的產品公司,美圖一直以來營造的是一個接地氣的親和品牌形象,隨着科技感更強的手機品牌的推出,美圖也逐漸在人工智能領域尋找更強的存在感。在「百變背景」正式推出之前,美圖就把相關 Demo 搬到了學術大會 VALSE(視覺與學習青年學者研討會)上

這場四月中旬召開的學術會議,參會者達 2500 多人,聚攏了國內頂尖 AI 公司代表和計算機視覺青年研究人才。

在 VALSE 用於展示論文 Poster 牆的附近,就是 Demo 區,排列着國內大大小小的計算機視覺公司展臺,包括 BAT、曠視科技、格靈深瞳、雲從科技、滴滴出行等。與其它 AI 公司展臺動輒「識別率」和人臉比對系統坐鎮的高冷範兒相比,美圖展臺的 Demo 產品更易令人產生參與的慾望,試玩的人自然絡繹不絕,內行走過,也會不禁唸叨一句「喲,他們家產品挺有意思」。

專訪美圖 CTO 張偉:5年以前,我們也不會想到會花 70% 的時間在人工智能上

(VALSE 現場圖)

不可否認,美圖的產品招人喜歡。

美圖在人工智能領域並不算喊得很大聲的那一個,但是動作下得很早。

2010 年,美圖成立了一個專注於前沿影像技術研發的實驗室:MTLAB(美圖影像實驗室)。這次推出的「百變背景」功能,就出於 MTLAB 之手。

MTLAB 地理上分佈在北京、廈門和深圳,北京注重於長期、基礎性技術研究,廈門 MTLAB 側重 AI 應用落地,深圳則偏重於硬件產品的算法支持。這個實驗室早在 2012 年的時候就關注了深度學習技術。美圖 CTO 張偉在接受雷鋒網採訪時,介紹道:

「大概在 2011、12 年就開始加入人工智能部分的研發了。原因是,這東西一開始看起來是萬能的,當然後面發現有很多問題。」

專訪美圖 CTO 張偉:5年以前,我們也不會想到會花 70% 的時間在人工智能上

(美圖 CTO 張偉)

雖然不同地區實驗室側重點不同,但是爲了確保研發和產品的無縫銜接,往往會把同一個項目的研發人員,分在北京、廈門和深圳三地。其他部門的員工,大約每兩週都要與實驗室的同事碰頭,產品經理分享新的 app 資訊,實驗室同事分享新的 paper 和技術趨勢。

實際上,一個新的產品功能,都是在研發和產品團隊反覆「磋商」的氛圍中誕生的。

「我們基本上是一個研發小組先做 demo,demo 不錯的話,交給一箇中間架構團隊把它封裝成一個組件,交給前端。然後在公司裏面去問,哪個產品團隊對這個新技術感興趣?有團隊感興趣的話,產品團隊裏的設計師們,就會拿過去做二次開發,然後再對這個組件提一些性能、速度、效果方面的建議。」

談及美圖來這次 VALSE 大會的緣由,張偉經常提到一個詞彙就是「看到」。美圖雖然是年資較長的上市公司,在人工智能領域投入也不菲,但 AI 這個標籤並不是其與生俱來的。就算是在人工智能領域重度參與的英偉達,其 CEO 黃仁勳還在最近的採訪中表示「將來某一天,我們可能會成爲一家人工智能計算公司」。這是向 AI 轉型的公司都要共同面臨的課題,要反覆向外界強調自己在 AI 領域的存在。所以美圖需要參加 AI 圈的活動,不論學術的還是業界活動:

「因爲我們畢竟在做 AI 這個領域,我們希望大家看到我們,我們也看到他們。」

如果不做人工智能,美圖就會空掉

人工智能對於美圖公司來說,到底處在一個什麼樣的位置?作爲 CTO 的張偉一句話說明了一切:

我花 70% 的時間在上面...... 我們覺得如果再過三年,這家公司不做 AI,可能就會空掉了。

美圖從一家工具型公司,往人工智能公司轉型,不僅僅是出於產品需求,更是攸關性命的一項抉擇。在他看來,人工智能這項技術,可以把美圖已有的東西重新刷一遍,將技術水平提升到一個前所未有的高度。

「很多人工智能創業公司有個問題,就是『爲人工智能而人工智能』,這不是一個合理的東西。但我們就是有一個很明確的目標,比如女性變美這件事情,這件事情很垂直,深度學習能做嗎?一定能做!大數據能不能起到作用,一定能起作用!」

李開復曾經盛讚美圖是一家「頂級人工智能公司」。對此,張偉本身的用詞會更加謹慎:

「開復老師這麼說,是對我們一個非常高的肯定。如果你去看開復老師對於人工智能的定義,是包含兩個方面,就是機器學習+大數據。那至少另外一半我們是有的。剩下的機器學習,我個人認爲,深度學習相關的東西,美圖已經涉及的足夠深了。」

衆所周知,美圖坐擁人臉和圖像數據巨礦,剩下的,就是對挖礦工具的深度打磨。張偉認可人工智能技術的巨大價值:

「整個世界都在等煉油的技術,數據就像石油一樣,如果沒有煉油的工具,石油就是一團黑水。但只要你有了煉油的工具,只要能挖到石油,那就跟印鈔機一樣。」

但同時,他是一個堅定的「非技術決定論者」,他認爲一項 AI 技術的成功應用,還涉及到產品、設計、商業等各種因素。

雖然美圖拿手的是人臉技術,但是出於對電商和廣告抱持的野心,美圖研發團隊的人員同樣投入大量精力在其他物體的識別技術上。

「我們內部做人臉的人數,跟做其它物體識別人數,比例爲 1:7。」

沒有對手,有什麼意思?

美圖的產品,並非沒有對手。例如打頭陣的美圖秀秀 app,市面上就有很多類似的競爭對手,而且有的是來自於 BAT 級別的公司,美圖當然有危機感,但對此張偉用了一個很性情的詞兒--「酷」。

「我們有很強的危機感,但這實際上是一件很酷的事情。沒有對手,有什麼意思?我們也知道一些競爭對手的相關團隊有挺多人,我們投入很大的精力和資金去追趕,但是當證明完自己之後,我們在想一個問題,就算你比其它公司多出 0.1%、0.2% 個點,還是遠遠不夠的。」

歸根結底,還是一個老觀點,技術並不是唯一決勝的關鍵,美圖的「顏值」生態鏈,包括龐大垂直的用戶羣、對用戶需求的精準把控、品牌效應和商業模式構成了一個完整的鏈條,這是其核心競爭力。

「我們每一個產品都有一個競爭對手,但是合在一起,我們覺得沒有像我們一樣的綜合體。我們的看法是,如果我們再把技術往深的地方做,一定會把別人拉開一大段距離。但即便拉不開大距離,以我們目前產品、運營、品牌的綜合實力,我們不會覺得有多大問題。因爲不只是比技術。」

所以,在 AI 技術方面,美圖並不忌諱借用外力。甚至爲了更快取得先機,會主動尋求與更多第三方合作機會。而美圖這次參加 VALSE 大會,其實也是爲了跟 AI 業界同仁進行一次深度的交流,談一談可能的合作。

「美圖不然自己做,不然就靠第三方的資源建立起來,構建自己獨一無二的生態系統...... 我們正在跟世界上很多不同的團隊,一起來做深度學習的工作,互相學習和交流,而我們也在做學術方面的工作。」

談及如今 AI 公司幾乎標配的「首席科學家」,張偉也是保持着開放的態度。

「每個公司邀請首席科學家的目的不同,可能是爲了更好的融資,也可能是爲了讓公司的技術水平進一步提升。對於美圖而言,如果一位科學家的加入能給我們的研發水準帶到一個新的高度,我們也很願意敞開懷抱去迎接他的到來。」

更多雷鋒網(公衆號:雷鋒網)文章,請關注雷鋒網官網:

百度端到端大規模語音識別系統 Deep Speaker,箭在弦上即將發佈

一分鐘看懂Facebook、Nvidia的這場「AI聯姻」

專訪美圖 CTO 張偉:5年以前,我們也不會想到會花 70% 的時間在人工智能上

文章來源:雷鋒網