亞馬遜AWS Re:Invent大會推出首款深度學習無線攝像機AWS DeepLens及五項機器學習新服務|業界資訊

 2017-11-30 12:18:00.0

原標題:業界 | 亞馬遜AWS Re:Invent大會推出首款深度學習無線攝像機AWS DeepLens及五項機器學習新服務

選自nlp.hivefire

AWS DeepLens 是世界上第一款深度學習型無線攝像機,可爲開發者提供機器學習的實踐經驗。Amazon SageMaker 是爲開發人員和數據科學家提供的全託管式服務,可以快速構建、培訓、部署和管理自己的機器學習模型。Amazon Transcribe、Amazon Translate、Amazon Comprehend 和 Amazon Rekognition Video 允許應用程序開發人員輕鬆構建將語音轉錄爲文本的應用程序,翻譯不同語言的文本,從文本中提取見解以及分析視頻。

Amazon SageMaker 使得機器學習模型的構建、訓練和部署更加簡單

今天在 AWS Re:Invent 現場,亞馬遜旗下公司 AWS (NASDAQ: AMZN) 宣佈推出 5 項機器學習新服務,以及一款面向開發者的深度學習型無線攝像機。Amazon SageMaker 是爲開發人員和數據科學家提供的全託管式服務,可以快速構建、培訓、部署和管理自己的機器學習模型。AWS DeepLens 是一款深度學習型無線攝像機,可以運行實時計算機視覺模型,爲開發者提供機器學習的實踐經驗。而且,AWS 還宣佈了 4 項新的應用服務,允許開發人員構建仿效人類認知的應用程序:Amazon Transcribe 將語音轉換爲文本;Amazon Translate 可以翻譯不同語言之間的文本;Amazon Comprehend 能夠理解自然語言;Amazon Rekognition Video 是一種新的計算機視覺服務,可以批量實時分析視頻。要了解有關 AWS 機器學習服務的更多信息,請訪問:https://aws.amazon.com/machine-learning.com。

AWS DeepLens

Amazon SageMaker 和 AWS DeepLens 使得所有開發者都可以使用機器學習

如今,實現機器學習非常複雜,涉及到大量的試錯,並需要專門的技能。開發人員和數據科學家必須首先對數據進行可視化、轉換和預處理,以將其轉化爲可以被算法用來訓練模型的格式。即使是簡單的模型也需要巨大的算力,並耗費大量時間進行訓練,公司可能需要僱傭專門的團隊來管理涵蓋多個 GPU 服務器的訓練環境。訓練模型的所有階段(從選擇和優化算法到調試影響模型準確性的數百萬參數)涉及大量的人爲努力和假設。然後,在應用程序中部署已訓練模型需要在應用程序設計和分佈式系統方面具備一系列不同的專業技能。隨着數據集和變量的增長,客戶不得不一再重複這個過程,因爲模型已經過時了,需要不斷地重新訓練,以便從新信息中學習和進化。所有這些都需要大量的專業知識、巨大的算力和存儲以及大量的時間。迄今爲止,機器學習對於大多數開發人員來說是遙不可及的。

Amazon SageMaker 是一項全託管式服務,可以消除機器學習過程中每一步的繁重工作和假設。它通過提供預先構建的開發 notebook,針對 PB 級數據集進行優化的常用機器學習算法以及自動模型調優,使得建模和訓練變得更加簡單。Amazon SageMaker 還大大簡化和加速了訓練過程,自動化配置和管理基礎設施以訓練模型和運行推理做出預測。AWS DeepLens 的設計從頭開始,旨在幫助開發人員通過將物理設備與大量教程、示例、源代碼以及與熟悉的 AWS 服務集成進行配對,獲得構建、訓練和部署模型的實踐經驗。

「我們最初的 AWS 願景是讓世界上(包括宿舍或車庫)的任何個人都能像巨頭公司那樣獲得相同的技術、工具、規模和成本結構。我們的機器學習願景也不例外,」AWS 機器學習副總裁 Swami Sivasubramanian 說。「我們希望所有的開發人員能夠更加廣泛和成功地使用機器學習,而不管他們的機器學習技能水平如何。Amazon SageMaker 消除了機器學習中涉及的許多麻煩和複雜性,使開發人員可以輕鬆上手,併成爲構建、訓練和部署模型的能手。」

通過 Amazon SageMaker,開發者可以:

  • 輕鬆構建擁有效能最優化算法的機器學習模型:Amazon SageMaker 是一個全託管式的機器學習 notebook 環境,可以使開發者輕鬆地探索和可視化他們保存在 Amazon Simple Storage Service(Amazon S3)上的數據,並可使用所有流行的庫、框架和接口轉換數據。Amazon SageMaker 包含 10 種最常用深度學習算法(例如,k-均值聚類、分解機、線性迴歸和主成分分析),並經過 AWS 最優化從而可以獲得比標準實現快 10 倍的運行速度。開發者只需要選擇一個算法並指定數據來源,Amazon SageMaker 就會安裝和配置相應的驅動和框架。Amazon SageMaker 原生集成了 TensorFlow 和 Apache MXNet,很快將添加對其它框架的支持。開發者也可以指定自己選擇的任何框架和算法,只需把它們上傳到 Amazon EC2 Container Registry 的一個容器。

  • 快速的全託管訓練:Amazon SageMaker 使訓練過程變得簡單。開發者只需要選擇 Amazon EC2 實例的類型和數量,並指定數據的位置。然後 Amazon SageMaker 將建立分佈式計算集羣,進行訓練,並把結果輸出到 Amazon S3,完成之後解散計算集羣。Amazon SageMaker 可以通過超參數優化自動地調整模型,調整數千種不同的算法參數的組合以達到最準確的預測結果。

  • 一鍵將模型部署到產品中:Amazon SageMaker 針對的是實例的應用、模型的部署、爲應用構建可靠的 HTTPS 端點(end-point)以獲得高傳輸率和低延遲的預測,以及將 Amazon EC2 的實例自動擴充到多重可用區(multiple availability zones,AZs)。它還提供了對 A/B 測試的原生支持。一旦部署到產品上,Amazon SageMaker 就能消除由機器學習基礎建設管理、健康檢查執行、安全補丁應用以及其它日常維護管理帶來的繁重工作。

通過 AWS DeepLens,開發者可以:

  • 獲得親自動手機器學習的經驗:AWS DeepLens 是新一類的產品:可以執行深度學習的完全可編程攝像機,其設計的目的就是爲了把深度學習送到每一個開發者手上(沒錯,就是字面上的意思)。AWS DeepLens 包括一個高清攝像機,內置了可以實時運行復雜深度學習計算機視覺模型的機載計算機。其中專門設計的硬件可以每秒運行超過 1000 億次深度學習運算,自帶了示例項目、示例代碼和預訓練模型,因此即使是沒有機器學習經驗的開發者也可以在 10 分鐘之內運行自己的第一個深度學習模型。開發者可以進一步使用 AWS Lambda 函數創建自定製的、深度學習驅動的項目。例如,可以對 AWS DeepLens 編程以識別車牌號碼,並觸發家庭自動化系統打開車庫的門,或者識別跑到沙發上的狗然後給主人發消息提醒。

  • 在雲中訓練模型並將其部署到 AWS DeepLens:AWS DeepLens 與 Amazon SageMaker 集成,以便開發人員可以使用 Amazon SageMaker 在雲中訓練其模型,然後只需在 AWS Management Console 中點擊幾下便可將其部署到 AWS DeepLens 中。攝像機將在設備上實時運行模型。

新的語音、語言和視覺服務使應用程序開發人員能夠輕鬆打造智能應用程序

對於那些不是機器學習專家,但有興趣使用這些技術構建展現人類一般的智能的新應用開發者,Amazon Transcribe、Amazon Translate、Amazon Comprehend 和 Amazon Rekognition Video 提供了高質量、高精確的具有可擴展性和成本效益的機器學習服務。

「如今,客戶使用亞馬遜簡易存儲服務(Amazon S3)作爲可擴展、可靠和安全的數據湖,存儲的數據比以往任何時候都多,他們希望將這些數據爲公司和客戶所用,因此需要容易上手的工具和技術開啓數據中的智能,」AWS 機器學習副總裁 Swami Sivasubramanian 表示,「我們很高興能夠提供 4 種全新的機器學習應用服務,以幫助開發人員立即開始創建新一代的智能應用程序,可以看到、聽到、說話,並與周圍的世界進行互動。」

  • Amazon Transcribe(可用預覽版本)將語音轉換爲文本,允許開發人員將存儲在 Amazon S3 中的音頻文件轉換爲準確、完整的標點符號文本。Amazon Transcribe 已接受訓練,可高度準確地處理低保真音頻,如聯絡中心的錄音。Amazon Transcribe 可以爲每個單詞生成一個時間戳,以便開發人員可以精確地將文本與源文件對齊。目前,Amazon Transcribe 支持英語與西班牙語,後續會支持更多語言。在未來的幾個月,Amazon Transcribe 將能夠識別音頻文件中的多個揚聲器,並且還將允許開發人員上傳自定義詞彙表,以便爲這些詞語進行更精確的轉錄。

  • Amazon Translate(可用預覽版本)使用當前最佳的神經機器翻譯技術提供兩種語言之間的高準確率的文本翻譯。Amazon Translate 可以翻譯短文本和長文本,並支持英語對其它六種語言(阿拉伯語、法語、德語、葡萄牙語、簡體中文和西班牙語)的翻譯,到 2018 年會支持更多類型。

  • Amazon Conprehend(可用)可以理解自然語言文本,包括文檔、社交網絡博客、文章或任何其它保存在 AWS 的文本數據。Amazon Conprehend 使用深度學習技術識別文本實體(例如,人物、地點、日期、組織)、文本使用的語言、文本表達的情緒,以及概念、形容詞的關鍵詞語(例如,漂亮的、溫暖的或晴朗的)。Amazon Comprehend 已經經過了廣泛的數據集的訓練(其中包括 Amazon.com 上的產品描述和用戶評價),以建立從文本中提取關鍵特徵的最佳語言模型。它還擁有對標題進行建模的能力,可以幫助應用從文本的主體中提取常用的標題。Amazon Comprehend 還整合了 AWS Glue 以允許對保存在 Amazon S3、Amazon Redshift、Amazon Relational Database Service(Amazon RDS)、Amazon DynamoDB 或其它常用的 Amazon 數據源上的文本數據進行端到端的分析。

  • Amazon Rekognition Video(可用)可以在保存在 Amazon S3 的幾百萬部視頻中追蹤人、檢測活動,以及識別目標、面部、名人和不宜內容。它還可以對直播視頻實時識別數百萬張人臉。Amazon Rekognition Video 的易用 API 由計算機視覺模型驅動,這些模型被訓練用於準確檢測數千個目標和活動,並可以從直播視頻流和保存在 Amazon S3 上的視頻內容中提取基於運動的語境。Amazon Rekognition Video 可以自動地爲視頻的特定部分加上標籤以及標記位置(例如,海灘、太陽、兒童),檢測活動(例如跑步、跳躍、游泳),檢測、識別和分析人臉,追蹤多個人(即使他們在視頻中被部分隱藏)。

原文鏈接:http://nlp.hivefire.com/articles/share/90598/

文章來源:機器之心