AI加持，計算機要擁有嗅覺了

2017-02-22 09:42:00.0

本文作者Robert F. Service，是俄勒岡州波特蘭的科學新聞記者，涉及化學，材料科學和能源故事，由雷鋒網AI科技評論編譯。

辨識顏色是件容易的事情：只要光的波長爲510納米，大多數人就會說它是綠色。然而，要想根據一個特定的分子特徵辨識出對應的味道，那是非常困難的。現在這個難題有新的解決方案了。雷鋒網瞭解到，22個計算機科學家團隊公佈了一套算法，能夠根據不同分子的化學結構來辨識不同氣味。這些方案可以發揮什麼作用仍有待觀察。但是有一種可能，這些的算法可以幫助香味商和食品生產者設計新型的氣味劑，而且可以量身定製某種味道。

嗅覺研究員Leslie Vosshall與紐約洛克菲勒大學的同事在最近的一項研究中，讓49名志願者評價了476小瓶純氣味劑。志願者用19個標籤對每一瓶氣味劑打標評價，包括「魚」、「大蒜」、「甜」或「燒焦」等。他們還評定每個氣味劑帶來的愉悅感及強烈度，總共收集超過100萬個數據點，構建了關於這些氣味分子的海量數據庫。

兩年前，計算生物學家Pablo Meyer在洛克菲勒大學學習時，他發現計算機科學家可以用這套數據集來研究人類評價氣味的機制。除了在紐約約克敦海茨的IBM Thomas J. Watson研究中心工作之外，Meyer還主導了一個名爲DREAM挑戰的競賽，旨在讓計算機科學家團隊解決突出的生物醫學問題，例如基於臨牀數據預測前列腺癌治療的結果，或從乳房的X線照片數據檢測乳腺癌。「我從研究生院知道，嗅覺的運行機制仍然是一個謎，」Meyer說。儘管研究人員已經在人體中發現了大約400種不同的氣味受體，但他補充說，這些氣味受體是如何協作來區分不同氣味，很大程度上仍然是一個謎。

2015年，Meyer和他的同事們舉辦了DREAM嗅覺辨識挑戰賽。他們將洛克菲勒團隊收集到的氣味數據集分爲三部分，參與者被給予三分之二的志願者評級數據集，包括產生每種氣味的分子化學結構。他們還給每種分子打了超過4800個標籤，例如分子的原子組合，排列和幾何形狀，構成了超過200萬個數據點的獨立數據集合。然後使用這些數據集來訓練他們的計算機嗅覺辨識模型，輸入的特徵是分子的化學結構。剩餘的三分一的數據作爲驗證集，包括69個味道評價數據及其相應的化學信息，被用來評估模型的辨識味道的準確度，辨識結果與49人的平均評級結果和個體的評級結果做比較。

來自全球的22個團隊迎接了挑戰。許多團隊表現良好，但有兩個團隊脫穎而出，安娜堡的密歇根大學計算機科學家Yuanfang Guan領導的一個小組，在模擬單個受試者的氣味評價中表現最佳。坦佩亞利桑那州立大學Richard Gerkin領導的另一個團隊，在模擬參與者平均氣味評價中表現最佳，Meyer和他的同事在《Science》期刊中報道。

「我們瞭解到，我們可以將特定的分子結構與氣味的描述對應起來，」Meyer說。例如，具有硫基團的分子傾向於產生「大蒜」氣味，具有香草醛類似的化學結構的分子，受試者則會感受到「麪包店」氣味。

Meyer建議這樣的模型可以幫助香料和香料公司構建新的分子結構，調出特定的氣味，如檀香或柑橘味。但是，來自科羅拉多州柯林斯堡Synesthetics的生物心理學家Avery Gilbert，一個經驗豐富的香水和香精行業老兵，不太確定這種方式的可行性。Gilbert認爲這項研究工作是有用的，因爲它提供了龐大的數據集。但是，用19種標籤來標識不同氣味的實在是太侷限了，用來描述氣味的屬性太少。另一項研究中已經讓志願者用80個或更多屬性來評價不同的氣味。

據雷鋒網(公衆號：雷鋒網)瞭解，當前的研究表明，計算機可以預測人們會用19個標籤中的哪一個來描述聞到的這一組氣味，但不清楚如果有更多的標籤，同樣的人工智能程序是否還能準確預測人類會使用的標籤。 Gilbert說，如果你用不同的描述符，可能需要不同的模型才能預測他們的評價，所以他不知道這個方法在什麼程度可以超越人類。也許這個觀點的主要作用是提醒，氣味辨識仍然是人類科學家和人工智能的挑戰。

via Artificial intelligence grows a nose

文章來源：雷鋒網