谷歌開源AI模型「搜索引擎」，NLP、CV都能用

2021-02-21 17:00:10.0

好消息，谷歌將AutoML算法庫開源了！

這個名爲「模型搜索」（Model Search）的平臺，不僅可以用多個AutoML算法自動寫出你想要的AI模型，還能幫你選出寫得最好的那個。

最重要的是，各個領域都能用。

也就是說，以往只支持NLP、圖像分類等等單一領域模型搜索的AutoML算法，現在被整合到了一個平臺上，可以幫你構建任何AI模型。

現在，無需再重新設計參數、或反覆微調，「AI設計師」就能幫你寫出想要的模型。

「模型搜索」是個什麼平臺

此前，AutoML算法已經被應用到了各個領域，用來減輕神經網絡設計專家的負擔。

這種算法，目的是讓AI來設計神經網絡，自動對網絡深度、層類型、結構、優化算法等因素進行合理搭配，效果通常比人工直接設計更好。

然而，這種由AI來設計AI模型的方法，會面臨兩個問題。

其一，這些算法通常只能針對某一特定領域，無法被應用到其他領域中。

例如針對NLP的AutoML算法，就無法設計出圖像分類的AI模型。

其二，計算量很大。

之前的NAS和PNAS算法，往往需要訓練數千個模型，才能找到效果最好的。

針對這兩個問題，谷歌現在推出了「模型搜索」開源平臺，致力於解決它們。

這個系統由多個訓練器（trainer）、1個搜索算法、1個遷移學習算法和1個包含多種評估模型的數據庫構成。

過程中，每個訓練器都會獨立地構建模型、進行試驗，但這些訓練器能共享數據，並採用橫向搜索，決定下一步嘗試什麼樣的模型。

「模型搜索」能根據一組預定義模塊，來構建神經網絡模型，每個模塊包含一個經典微結構，包括LSTM、ResNet或是Transformer中的某些層等等。

這種微結構的模式，也減少了搜索規模，因爲它探索的是這些模型的結構，而非更詳細的基本部分。

而爲了進一步提高效率和準確性，這一算法還能在訓練器完成各種實驗時，進行遷移學習。主要通過知識提取和參數分配兩種方法。

通過知識提取，新模型可以從高性能模型中借鑑損失函數，提高自身準確性；而通過參數分配，新模型採用之前訓練模型中的部分參數，並初始化剩餘的參數，就能訓練得更快。

在逐漸迭代的過程中，最好的模型就被「搜索」出來了。

谷歌表示，「模型搜索」是個具有自適應性、貪婪性、而且比強化學習算法收斂速度更快的算法。

這個算法，目前具有如下功能：

可以在數據上運行多個AutoML算法，可以自動搜索合適的模型結構、模型融合方法，並選擇最佳模型。
可以比較在搜索時發現的不同模型；
可以自行設計特殊的神經網絡層並應用。

目前，「模型搜索」支持Tensorflow框架。

也就是說，各模塊都能實現任何以張量爲輸入的函數。

比人類設計得好，比PNAS更高效

經過實驗，「模型搜索」平臺搞出來的AI模型，確實還不錯。

作者們用「模型搜索」平臺，試着寫了個語音AI模型，主要功能是關鍵字檢測和語言識別。

下圖中，實線是AI寫出來的模型迭代精度，虛線則是此前人工設計出的SOTA模型。

顯然，無論是最小迭代次數、還是最後的迭代精度，「模型搜索」平臺用AI寫出的模型，都比人工設計的要好得多。

也就是說，設計所用的參數量更少了（相比於人工設計的31.5萬，AI只需要18.4萬），精度反而還上升了。

那麼，這個「模型搜索」框架的搜索效果，相比於其他用AI寫AI模型的搜索算法，哪個效果更好？

作者們用CIFAR-10數據集試了試圖像分類模型。

測試發現，用AutoML嘗試寫了209個模型後，最好的模型就已經達到了91.83%的精確度。

而此前，NasNet需要嘗試5807次、PNAS需要嘗試1160次，才能達到相同的精度。

也就是說，用這個平臺設計的AI模型，不僅能達到在某些領域達到比人類設計更好的效果，還比其他「AI設計師」速度更快。

不想辛苦調參的話，這絕對是個非常理想的模型設計平臺了。

不包含全部AutoML算法

所以，谷歌當真就把自己之前的收費項目開源了？

不不不。

更高級的AutoML算法，目前還是要收費的。

這是個名爲AutoML Tables的項目，無需寫代碼，它就能幫你自動構建和部署最先進的機器學習模型。

而性能最優的AutoML算法，目前都包含在這裏面了。

目前，谷歌已經將AutoML、MLOps、AI Platform整合到一起，成爲了一個更大的AI Platform平臺。

當然，也是要付費的。

也就是說，目前開源的這個「模型搜索」平臺，只包含一部分AutoML算法。

作者介紹

Hanna Mazzawi，谷歌研究工程師，研究方向是機器學習、算法設計和分析、數學軟件。

Xavi Gonzalvo，碩博均畢業於西班牙拉蒙尤以大學（Ramon Llull University），目前在谷歌任研究科學家，從事機器智能相關的工作。

如果想快速寫出需要的AI模型，可以上手這個項目了~

項目地址： https://github.com/google/model_search

參考鏈接： https://cloud.google.com/automl-tables https://ai.googleblog.com/2021/02/introducing-model-search-open-source.html

—完—
@量子位 · 追蹤AI技術和產品新動態
深有感觸的朋友，歡迎贊同、關注、分享三連վ'ᴗ' ի ❤

文章來源：量子位