本文作者Robert F. Service,是俄勒岡州波特蘭的科學新聞記者,涉及化學,材料科學和能源故事,由雷鋒網AI科技評論編譯。
辨識顏色是件容易的事情:只要光的波長爲510納米,大多數人就會說它是綠色。然而,要想根據一個特定的分子特徵辨識出對應的味道,那是非常困難的。現在這個難題有新的解決方案了。雷鋒網瞭解到,22個計算機科學家團隊公佈了一套算法,能夠根據不同分子的化學結構來辨識不同氣味。這些方案可以發揮什麼作用仍有待觀察。但是有一種可能,這些的算法可以幫助香味商和食品生產者設計新型的氣味劑,而且可以量身定製某種味道。
嗅覺研究員Leslie Vosshall與紐約洛克菲勒大學的同事在最近的一項研究中,讓49名志願者評價了476小瓶純氣味劑。志願者用19個標籤對每一瓶氣味劑打標評價,包括「魚」、「大蒜」、「甜」或「燒焦」等。他們還評定每個氣味劑帶來的愉悅感及強烈度,總共收集超過100萬個數據點,構建了關於這些氣味分子的海量數據庫。
兩年前,計算生物學家Pablo Meyer在洛克菲勒大學學習時,他發現計算機科學家可以用這套數據集來研究人類評價氣味的機制。除了在紐約約克敦海茨的IBM Thomas J. Watson研究中心工作之外,Meyer還主導了一個名爲DREAM挑戰的競賽,旨在讓計算機科學家團隊解決突出的生物醫學問題,例如基於臨牀數據預測前列腺癌治療的結果,或從乳房的X線照片數據檢測乳腺癌。「我從研究生院知道,嗅覺的運行機制仍然是一個謎,」Meyer說。儘管研究人員已經在人體中發現了大約400種不同的氣味受體,但他補充說,這些氣味受體是如何協作來區分不同氣味,很大程度上仍然是一個謎。
2015年,Meyer和他的同事們舉辦了DREAM嗅覺辨識挑戰賽。他們將洛克菲勒團隊收集到的氣味數據集分爲三部分,參與者被給予三分之二的志願者評級數據集,包括產生每種氣味的分子化學結構。他們還給每種分子打了超過4800個標籤,例如分子的原子組合,排列和幾何形狀,構成了超過200萬個數據點的獨立數據集合。然後使用這些數據集來訓練他們的計算機嗅覺辨識模型,輸入的特徵是分子的化學結構。剩餘的三分一的數據作爲驗證集,包括69個味道評價數據及其相應的化學信息,被用來評估模型的辨識味道的準確度,辨識結果與49人的平均評級結果和個體的評級結果做比較。
來自全球的22個團隊迎接了挑戰。許多團隊表現良好,但有兩個團隊脫穎而出,安娜堡的密歇根大學計算機科學家Yuanfang Guan領導的一個小組,在模擬單個受試者的氣味評價中表現最佳。坦佩亞利桑那州立大學Richard Gerkin領導的另一個團隊,在模擬參與者平均氣味評價中表現最佳,Meyer和他的同事在《Science》期刊中報道。
「我們瞭解到,我們可以將特定的分子結構與氣味的描述對應起來,」Meyer說。例如,具有硫基團的分子傾向於產生「大蒜」氣味,具有香草醛類似的化學結構的分子,受試者則會感受到「麪包店」氣味。
Meyer建議這樣的模型可以幫助香料和香料公司構建新的分子結構,調出特定的氣味,如檀香或柑橘味。但是,來自科羅拉多州柯林斯堡Synesthetics的生物心理學家Avery Gilbert,一個經驗豐富的香水和香精行業老兵,不太確定這種方式的可行性。Gilbert認爲這項研究工作是有用的,因爲它提供了龐大的數據集。但是,用19種標籤來標識不同氣味的實在是太侷限了,用來描述氣味的屬性太少。另一項研究中已經讓志願者用80個或更多屬性來評價不同的氣味。
據雷鋒網(公衆號:雷鋒網)瞭解,當前的研究表明,計算機可以預測人們會用19個標籤中的哪一個來描述聞到的這一組氣味,但不清楚如果有更多的標籤,同樣的人工智能程序是否還能準確預測人類會使用的標籤。 Gilbert說,如果你用不同的描述符,可能需要不同的模型才能預測他們的評價,所以他不知道這個方法在什麼程度可以超越人類。也許這個觀點的主要作用是提醒,氣味辨識仍然是人類科學家和人工智能的挑戰。