CVPR 2017大會主席張正友博士:做研究要靜得下心,沉得住氣|CVPR 2017

 2017-07-27 11:40:00.0

雷鋒網 AI 科技評論按:截至發稿前,四篇榮獲 CVPR 2017 最佳論文的作者已經分別做了口頭報告,而在到場聆聽報告的所有人當中,有一位略顯特別的聽衆——他便是本屆 CVPR 的大會主席、微軟研究院首席研究員張正友博士。在報告結束後,張正友主席與雷鋒網 AI 科技評論進行了一次對話。

CVPR 2017大會主席張正友博士:做研究要靜得下心,沉得住氣|CVPR 2017


張正友,ACM Fellow (國際計算機學會院士)和 IEEE Fellow (國際電氣電子工程師學會院士),是微軟人工智能及研究事業部首席研究員和研究經理,加入微軟美國本部已近二十年。1990年獲得巴黎第十一大學博士學位,在法國國家計算機和自動化研究院(INRIA)學習工作近十二年。張正友博士是世界著名的計算機視覺和多媒體技術的專家,在立體視覺、三維重建、運動分析、圖像配準、攝像機自標定、人臉表情識別等方面都有開創性的貢獻。他發明的平板攝像機標定法在全世界被普遍採用,被稱之爲「張氏方法」。

與密切關注論文頒獎結果的老師同學們不一樣的是,張正友博士對「最佳論文」並沒有那麼看重。他認爲,這與論文所產生的影響力(impact)並不能同一而論。「我們可以回看過去十年 CVPR 或是 ICCV 的最佳論文,幾乎沒有一篇能獲得 test of time award,」張正友博士表示,每年的最佳論文很大程度是由當年的熱門選題決定的,雖然由資深的教授和研究員擔綱評估,但畢竟是少數幾個人的看法。這些論文雖然都是很不錯的論文,但多年以後,它們的引用次數不一定是最高的,也不一定能「經得起時間考驗」,獲得像 Longuet-Higgins 這樣的獎項。

正如今年的 Longuet-Higgins 所授予的 Test of Time 論文《Object Retrieval with Large Vocabularies and Fast Spatial Matching》一樣,當年的最佳論文並不歸屬於它。而張正友博士的親身經歷同樣是最好的例證——憑藉 1999 年在 ICCV 上發表的關於攝像機標定的文章《Flexible Camera Calibration by Viewing a Plane from Unknown Orientations》及後續在 IEEE T-PAMI 上發表的文章《A Flexible New Technique for Camera Calibration》,張正友博士在 2013 年榮獲由 IEEE 模式分析與機器智能技術委員會(PAMI TC)授予的 Helmholtz Test of Time 獎。值得一提的是,當年他將這篇 ICCV 論文投遞給 CVPR,卻沒被錄用。

「要靜得下心,要沉得住氣,」是張正友博士在 IJCV Lobster Night 上演講的中心思想。而他自己的研究工作,也嚴格遵循着這一原則。從 1988 年到 2002 年,14 年來,張正友博士一直按着每兩年選擇一個課題的節奏,對業界重要的問題進行深入細緻的研究,而他每兩年的研究成果幾乎每個都在計算機視覺界產生了比較大的影響。同時,張正友博士也評論道,他個人並不反對學生對熱點話題(hot topic)的關注,也理解他們有着每年多出幾篇文章的壓力,但希望他們能從行業的真正需求出發,將目光放得長遠一些。

作爲過來人,張正友博士感慨道,如今的學生與以前的學習方式迥乎不同。以前由於條件限制,學生的每一行代碼都需要自己從頭開始編寫,但也正因爲這樣,學生對推導的每一步都非常瞭解,基礎也相對紮實;而如今互聯網資源非常豐富,學生往往沒有花足夠的時間理解算法背後的原理,也沒有耐心關注基礎問題的研究。

「我覺得同學們沒有必要爲了多發表幾篇文章而犧牲了思考這些問題的機會。雖然能在熱點研究領域做些改進使其在數據集上呈現比較好的結果,發表文章相對容易,但像深度學習這樣的熱點總會過去。如果沒有獨到的貢獻,明年還有人知道你的工作嗎?」

時光荏苒,曾經作爲論文投遞者和會議參與者的張正友博士,如今已經成爲了 CVPR 2017 的大會主席,以重要推動者的身份組織着本次大會。根據本次大會的官方資料,CVPR 2017 的與會人數達到 4950 人,達到了歷史高峯;本次論文有效投遞數爲 2620 篇,收錄 783 篇,投遞數目比去年增加了40%。

自然,這對於會務的組織者而言是一個不小的挑戰:由於投遞的論文數量過多,爲了在規定時間內完成評審任務,組委會不得不緊急增加一些評審人;針對去年CVPR因爲人數劇增暴露出的後勤保障混亂、中間休息的咖啡不足、展會和 posters 空間擁擠等問題,組委會爲這次 CVPR 做了很長的準備,在會議中心預留了6000人的空間,並僱傭了一個專業的支持展會的承包商。組委會齊心協力辦一場出色的 CVPR,不僅是爲了促進計算機視覺領域在人工智能領域的交流;也是一次 CV 圈展現自我的機會。雖然參加 CVPR 的人數從去年的 3650 人增加到了今年的 4950 人,但整個會議進展非常順暢,大家的反饋也非常滿意。

而在這次會議中,AI 科技評論的一個明顯感受是華人面孔非常多;關於這一點,張正友博士表示,由於今年自己擔任大會主席,劉燕西博士和吳郢博士擔任程序委員會主席,因此在區域主席的選擇上,也有意識地增加了華人的比重,希望能夠提升華人在學術領域的影響力。在組委會的其它位置,比如企業關係主席,也儘可能安排能幹的華人擔任。就像吳郢博士在 IJCV Lobster Night 上的發言所說,大部分的論文作者中,至少會出現一個亞洲名字;口頭報告中涌現越來越多的亞洲面孔;而贊助商也有很多來自亞洲國家。中國作爲亞洲的重要大國,華人自然也是這一羣體的中堅力量。

然而,張正友博士也發現,雖然華人在學術會議裏的地位和力量不可小視,但當這些優秀的華人學生畢業之後,能留在學術界持續做貢獻的人並不多,很多會轉投工業界繼續做研究或是創業。以往計算機視覺的學生很難找到工作,而現在,隨着它的持續發展繁榮,學生們也成爲了工業界關注和爭奪的對象,投身工業界也成爲了順理成章的事情。以 CVPR 2017 爲例,本屆會議的贊助商達到 127 家,總贊助費超過 85.9 萬美金。這也從側面體現出了工業界對學術人才的龐大需求。不過張正友博士也認爲,這種「流失」實際上也與個人的選擇有關,「做研究的目的,一方面是爲了增加人類的知識,發掘新的方法;另一個還是要對社會產生影響,在工業界工作算得上是其中一種方式吧。」

張正友博士對計算機視覺的未來充滿了信心,也呈現非常樂觀的態度。他認爲,無論從論文的投遞數目,還是展商對學術會議的高度關注來看,都反映出計算機視覺是一個非常具有前景的領域。「深度學習也不只是大數據的遊戲,有人已經開始研究如何將深度學習和幾何概念和物理信息結合。此外,計算機視覺也已經與很多領域有了交叉,比如爲了理解圖像,我們需要結合語言進行處理。而在未來,各個學科會以更加多樣化的形式融合。」同樣地,未來屬於富有創新力量的老師和同學們,未來的研究趨勢和浪潮,將由他們來引領和推動。

今天,CVPR 2017 已經進入尾聲,我們也期待下一年的 CVPR 能夠給我們帶來更多驚喜。更多資訊,敬請關注 CVPR,關注雷鋒網(公衆號:雷鋒網) AI 科技評論。

文章來源:雷鋒網