重大突破!斯坦福證明神經網絡能直接在光學芯片上訓練

 2018-07-27 16:44:59.0

據光學領域權威期刊Optica的報道,美國斯坦福大學的研究人員已經證明,可以直接在光學芯片上訓練人工神經網絡。這一重大突破錶明,光學電路可以實現基於電子的人工神經網絡的關鍵功能,進而可以以更便宜、更快速和更節能的方式執行語音識別、圖像識別等複雜任務。

「相比使用數字計算機,使用光學芯片進行神經網絡計算更有效,能夠解決更復雜的問題,」斯坦福大學研究團隊的負責人範汕洄(Shanhui Fan)說:「這將增強人工神經網絡的能力,例如,使其能夠執行自動駕駛汽車所要求的任務,或者能夠對口頭問題做出適當的回答。這將以我們現在無法想象的方式改善我們的生活。」

人工神經網絡是人工智能的一種,它使用連接的單元,以類似大腦處理信息的方式來處理信息。使用人工神經網絡執行復雜的任務,例如語音識別,需要訓練算法對輸入進行分類,比如對不同的單詞進行分類。

雖然光學人工神經網絡最近已經得到實驗證明,但此前的研究是在傳統的數字計算機上使用一個模型進行訓練步驟,然後將最終的設置導入光學電路。在最新Optica期刊上,斯坦福大學的研究人員報告了一種新方法,通過實現「反向傳播」算法(這是訓練傳統神經網絡的標準方法)的光學模擬,直接在設備中訓練人工神經網絡。

重大突破!斯坦福證明神經網絡能直接在光學芯片上訓練

圖:研究人員已經證明,神經網絡可以通過光學電路(圖中藍色矩形)進行訓練。在整個網絡中,有若干個這樣的電路連接在一起。激光輸入(綠色)的編碼信息由光波導(黑色)通過芯片。芯片使用可調波束分離器(光波導中彎曲的部分)執行對人工神經網絡至關重要的操作。分離器將兩個相鄰的波導連接在一起,並可通過調整光學移相器(紅色和藍色發光物體)的設置進行調整。分離器的作用就像「旋鈕」,可以在特定任務的訓練過程中進行調整。Credit: Tyler W. Hughes, Stanford University

該論文的第一作者Tyler W. Hughes說:「使用物理設備而不是計算機模型進行訓練,可以使訓練過程更精確。」「而且,由於訓練步驟是神經網絡實現中非常耗費計算力的部分,因此,在光學電路上執行這個步驟,對於改進人工神經網絡的計算效率、速度和功耗都是至關重要的。」

基於光的網絡

雖然神經網絡處理通常使用傳統的計算機進行,但仍有大量的工作要專門設計針對神經網絡計算優化的硬件。基於光學的設備非常吸引人,因爲它們可以並行地執行計算,同時比電子設備消耗的能量更少。

在這項新研究中,研究人員通過設計一種光學芯片來複制傳統計算機訓練神經網絡的方式,克服了實現全光學神經網絡(all-optical neural network)的一個重大挑戰。

人工神經網絡可以被視爲一個帶有許多旋鈕的黑盒。在訓練期間,每個旋鈕都要轉動一點,然後測試系統,查看算法的性能是否得到改善。

「我們的方法不僅可以幫助預測旋鈕轉動的方向,還可以預測每個旋鈕轉動的方向,從而更接近預期的性能。」Hughes說,「我們的方法大大加快了訓練速度,特別是對於大型網絡,因爲可以並行地獲得每個旋鈕的信息。」

片上訓練

新的訓練協議在具有可調諧光束分離器的光學電路運行,通過改變光學移相器的設置進行調整。具體來說,該方法是將編碼有待處理信息的激光束髮射到光學電路中,由光波導通過光束分離器進行傳輸,像旋鈕一樣進行調整,以訓練神經網絡算法。

重大突破!斯坦福證明神經網絡能直接在光學芯片上訓練

在新的訓練協議中,激光首先通過光學電路輸入。退出設備後,計算出與預期結果的差值。然後,這些信息被用來產生一個新的光信號,這個信號通過光網絡以相反的方向發送回來。

重大突破!斯坦福證明神經網絡能直接在光學芯片上訓練

通過測量此過程中每個分束器周圍的光強度,研究人員展示瞭如何並行地檢測神經網絡的性能隨着每個分束器設置而變化的情況。移相器的設置可以根據這些信息進行更改,這個過程可以重複,直到神經網絡產生期望的結果。

研究人員用光學模擬測試了他們的訓練技術,方法是教算法執行復雜的任務,比如在一組點中找出複雜的特徵。他們發現光學實現與傳統計算機的執行類似。

該研究的負責人範汕洄說:「我們的研究表明,你可以利用物理定律來實現計算機科學算法。」「通過在光學領域對這些網絡進行訓練,證明光學神經網絡系統可以利用光學器件來實現某些功能。」

研究人員計劃進一步優化這個系統,並希望用它來實現神經網絡任務的實際應用。他們設計的通用方法可用於各種神經網絡架構,也可以用於其他應用。

原文:https://phys.org/news/2018-07-closer-optical-artificial-neural-network.html

文章來源:36kr