寒武紀發佈機器學習處理器MLU:計劃未來三年佔領10億臺設備

 2017-11-06 15:42:00.0

原標題:寒武紀發佈機器學習處理器MLU:計劃未來三年佔領10億臺設備

11 月 6 日下午,寒武紀科技在北京舉辦了成立以來的首場發佈會。在會上,這家知名人工智能芯片公司的創始人陳天石發佈了面向視覺領域的寒武紀 1H8、性能更強的寒武紀 1H16,以及面向智能駕駛領域的寒武紀 1M,同時推出了面向開發者的人工智能系統軟件 Cambricon NeuWare。最後,陳天石宣佈了計劃 2018 年推出的機器學習處理器 MLU 系列。

全新的智能處理器 IP

作爲國內 AI 芯片的先行者,寒武紀科技的產品早已進入普通用戶的手中。10 月 16 日,華爲在德國慕尼黑髮布了新一代旗艦手機 Mate10 系列,其中搭載了華爲海思人工智能芯片麒麟 970。麒麟 970 首次集成了來自中科寒武紀的 NPU(寒武紀 1A 處理器)作爲神經網絡專用處理單元,同時採用異構計算架構大幅提升了 AI 任務算力。新的計算架構 HiAI 和計算單元對於機器學習任務處理性能(相對於手機 CPU)提升了數十倍,最高可達到傳統處理器 25 倍速度,50 倍能效。這種性能提升可以讓此前很多無法在移動端使用的機器學習應用走向工程化和實用化。麒麟 970 也成爲了全球首款人工智能處理器,這款芯片的出現意味着人工智能技術開始逐漸從理論、工程階段走向實用化,成爲了 AI 產業發展的一個里程碑。

當前的計算機架構中,CPU 負責通用任務計算,面向指令密集和邏輯控制運算;GPU 則是數據密集型,主要面向向量任務的圖形處理計算。對於人工智能領域的應用,目前人們面臨的主要任務是對於矩陣乘法的運算,這種任務使用 CPU 和 GPU 來做效率並不高。對於一個矩陣乘法,後兩種結構需要更多個指令週期來完成。針對這類任務,如果希望能夠在最短的時鐘週期內完成更多的神經網絡模型算子的運算,就需要專門的硬件來參與其中,寒武紀科技提出的 NPU 就是一種前沿方向。

寒武紀科技的產品路線圖覆蓋終端產品和服務器,在 NPU 實用化之前,該公司在 2016 年推出了寒武紀 1A 處理器(Cambricon-1A),它也成爲了全球首款商用深度學習專用處理器,面向智能手機、安防監控、可穿戴設備、無人機和智能駕駛等終端設備,在運行主流智能算法時性能功耗效率大幅超越 CPU 和 GPU。

在發佈會上,寒武紀第一次展示了 1A 處理器的全部性能

陳天石表示,「雖然 1A 誕生於 2016 年,但是在今天它仍然是市場上最爲強大的神經網絡處理器。它支持從上古時代的模型,到現代最新的模型。支持稀疏化神經網絡,到半精度處理。」

另外,中科曙光近日宣佈推出國內首款搭載寒武紀 AI 芯片的人工智能服務器「Phaneron」。「Phaneron 主要面向深度學習的在線推理業務環境。在線推理業務不同於離線訓練,推理不需要密集的計算能力,而是需要及時響應。因此,完成推理服務,需要大量的部署前端加速芯片以實時響應訪問請求,對數據迅速作出判斷,」中科曙光副總裁沙超羣在此前服務器的發佈中對此介紹道,「Phaneron 可以在 4U 空間中部署 20 個人工智能前端推理模塊,能夠爲推理提供強大的計算支持。」

在發佈會上,陳天石還展示了目前寒武紀的最新智能處理器系列:性能全面超越 1A 的寒武紀 1H16、面向視覺領域的寒武紀 1H8,以及面向智能駕駛領域的寒武紀 1M。「我們希望在不遠的將來,國內的智能汽車能夠全部用上國產的 AI 處理芯片。」陳天石表示。

寒武紀 1H8

寒武紀 1H16

寒武紀 1M 處理器

寒武紀軟件平臺 Cambricon Neuware

爲了讓廣大開發者更快獲得 AI 智能芯片的計算能力,寒武紀科技開發了完整的軟件平臺。目前,寒武紀軟件棧已經支持 TensorFlow、Caffe 和 MXNet 等深度學習框架。「在未來,寒武紀平臺還將推出安卓和蘋果系統的軟件 API,」陳天石表示,「所有軟件層次的研究開發都是由寒武紀自己完成的。」

寒武紀軟件棧

寒武紀軟件棧兼容主流深度學習框架,允許我們在其上開發稀疏和量化模型。並在其上直接生成寒武紀模型,通過 AI 芯片處理獲得更高效率。這款工具目前已支持原生 TensorFlow。

寒武紀軟件棧中包含了大量面向開發者的實用工具,「在寒武紀調優工具包上,我們可以給出模型,讓系統自動預測優化前後的性能。」陳天石介紹道。

重磅發佈機器學習處理器 MLU 系列

寒武紀最爲我們所熟知的產品就是神經網絡處理器 NPU。但寒武紀的產品線不僅於此,在今天的發佈會上,陳天石重磅發佈了寒武紀機器學習處理器 MLU 系列,希望將自己的產品從神經網絡加速拓展到機器學習,以及更多任務中。新的處理器產品將在未來 18 個月內推出。

陳天石表示,MLU 100 與 MLU 200 高性能芯片都將支持多種機器學習推理和訓練任務的加速,前者偏重推理,後者偏重訓練。此外,MLU 100 面向中小型服務器,而 MLU200 則面向企業級人工智能研發中心。

今年 8 月份,寒武紀科技獲得了價值 1 億美元的 A 輪融資,該輪投資由國投創業領投,阿里巴巴創投、聯想創投、國科投資、中科圖靈、元禾原點(天使輪領投方)、涌鏵投資(天使輪投資方)聯合投資。在本輪融資過後,這家背靠中科院計算所的創業公司估值已接近 10 億美元,成爲了全球第一家智能芯片領域獨角獸公司。

未來,寒武紀科技還將繼續與華爲、中科曙光等公司合作,進一步開發搭載人工智能專用芯片的計算基礎設施,在終端與服務器端共同發展,爲人工智能產業提供更強大的算力支持。「我們希望寒武紀能在 3 年後佔據中國高性能智能芯片市場 30% 的份額;在 3 年後,讓全球有 10 億臺設備集成寒武紀處理器的智能終端。我們現在與國外同行都是在同一個起跑線上的,」陳天石表示,「我們應該攜起手來共同塑造中國智能產業全新的生態。」

文章來源:機器之心