谷歌開源AI模型「搜索引擎」,NLP、CV都能用

 2021-02-21 17:00:10.0

好消息,谷歌將AutoML算法庫開源了!

這個名爲「模型搜索」(Model Search)的平臺,不僅可以用多個AutoML算法自動寫出你想要的AI模型,還能幫你選出寫得最好的那個。


最重要的是,各個領域都能用

也就是說,以往只支持NLP、圖像分類等等單一領域模型搜索的AutoML算法,現在被整合到了一個平臺上,可以幫你構建任何AI模型。

現在,無需再重新設計參數、或反覆微調,「AI設計師」就能幫你寫出想要的模型。

「模型搜索」是個什麼平臺

此前,AutoML算法已經被應用到了各個領域,用來減輕神經網絡設計專家的負擔。



這種算法,目的是讓AI來設計神經網絡,自動對網絡深度、層類型、結構、優化算法等因素進行合理搭配,效果通常比人工直接設計更好。

然而,這種由AI來設計AI模型的方法,會面臨兩個問題。

其一,這些算法通常只能針對某一特定領域,無法被應用到其他領域中。



例如針對NLP的AutoML算法,就無法設計出圖像分類的AI模型。

其二,計算量很大

之前的NAS和PNAS算法,往往需要訓練數千個模型,才能找到效果最好的。



針對這兩個問題,谷歌現在推出了「模型搜索」開源平臺,致力於解決它們。



這個系統由多個訓練器(trainer)、1個搜索算法、1個遷移學習算法和1個包含多種評估模型的數據庫構成。



過程中,每個訓練器都會獨立地構建模型、進行試驗,但這些訓練器能共享數據,並採用橫向搜索,決定下一步嘗試什麼樣的模型。

「模型搜索」能根據一組預定義模塊,來構建神經網絡模型,每個模塊包含一個經典微結構,包括LSTM、ResNet或是Transformer中的某些層等等。



這種微結構的模式,也減少了搜索規模,因爲它探索的是這些模型的結構,而非更詳細的基本部分。

而爲了進一步提高效率和準確性,這一算法還能在訓練器完成各種實驗時,進行遷移學習。主要通過知識提取和參數分配兩種方法。



通過知識提取,新模型可以從高性能模型中借鑑損失函數,提高自身準確性;而通過參數分配,新模型採用之前訓練模型中的部分參數,並初始化剩餘的參數,就能訓練得更快。



在逐漸迭代的過程中,最好的模型就被「搜索」出來了。

谷歌表示,「模型搜索」是個具有自適應性、貪婪性、而且比強化學習算法收斂速度更快的算法。

這個算法,目前具有如下功能:

  • 可以在數據上運行多個AutoML算法,可以自動搜索合適的模型結構、模型融合方法,並選擇最佳模型。
  • 可以比較在搜索時發現的不同模型;
  • 可以自行設計特殊的神經網絡層並應用。

目前,「模型搜索」支持Tensorflow框架。



也就是說,各模塊都能實現任何以張量爲輸入的函數。

比人類設計得好,比PNAS更高效

經過實驗,「模型搜索」平臺搞出來的AI模型,確實還不錯。

作者們用「模型搜索」平臺,試着寫了個語音AI模型,主要功能是關鍵字檢測和語言識別。

下圖中,實線是AI寫出來的模型迭代精度,虛線則是此前人工設計出的SOTA模型。



顯然,無論是最小迭代次數、還是最後的迭代精度,「模型搜索」平臺用AI寫出的模型,都比人工設計的要好得多。

也就是說,設計所用的參數量更少了(相比於人工設計的31.5萬,AI只需要18.4萬),精度反而還上升了。

那麼,這個「模型搜索」框架的搜索效果,相比於其他用AI寫AI模型的搜索算法,哪個效果更好?

作者們用CIFAR-10數據集試了試圖像分類模型。



測試發現,用AutoML嘗試寫了209個模型後,最好的模型就已經達到了91.83%的精確度。

而此前,NasNet需要嘗試5807次、PNAS需要嘗試1160次,才能達到相同的精度。

也就是說,用這個平臺設計的AI模型,不僅能達到在某些領域達到比人類設計更好的效果,還比其他「AI設計師」速度更快。

不想辛苦調參的話,這絕對是個非常理想的模型設計平臺了。

不包含全部AutoML算法

所以,谷歌當真就把自己之前的收費項目開源了?

不不不。

更高級的AutoML算法,目前還是要收費的。

這是個名爲AutoML Tables的項目,無需寫代碼,它就能幫你自動構建和部署最先進的機器學習模型。



而性能最優的AutoML算法,目前都包含在這裏面了。

目前,谷歌已經將AutoML、MLOps、AI Platform整合到一起,成爲了一個更大的AI Platform平臺。

當然,也是要付費的。

也就是說,目前開源的這個「模型搜索」平臺,只包含一部分AutoML算法。

作者介紹

Hanna Mazzawi,谷歌研究工程師,研究方向是機器學習、算法設計和分析、數學軟件。



Xavi Gonzalvo,碩博均畢業於西班牙拉蒙尤以大學(Ramon Llull University),目前在谷歌任研究科學家,從事機器智能相關的工作。

如果想快速寫出需要的AI模型,可以上手這個項目了~

項目地址: github.com/google/model

參考鏈接: cloud.google.com/automl ai.googleblog.com/2021/


—完—
@量子位 · 追蹤AI技術和產品新動態
深有感觸的朋友,歡迎贊同、關注、分享三連վ'ᴗ' ի ❤

文章來源:量子位