編者按:亞馬遜首席科學家 Rohit Prasad 接受記者採訪,討論了智能家居 AI 的前景,以及 Echo 和 Alexa 的最近進展。他特別提到,Alexa 作爲平臺爲開發者提供了多項「福利」,包括內置「用戶意圖」和詞庫,供開發者整合入他們的軟件應用。這意味着,在亞馬遜 Alexa 平臺上的開發者,可以直接利用 Alexa 的內置工具包使軟件應用更智能,極大節約了時間和精力。隨着 Echo 的熱賣,目前,Alexa 平臺已吸引約 5000 名開發者。Alexa 是否會異軍突起,成爲未來智能家居甚至是物聯網的通用平臺?
一場冰與火之歌式的 AI 爭霸正在科技巨頭之間展開,參與者有亞馬遜、谷歌、蘋果、微軟、Facebook 等巨頭。弔詭的是,相比雷聲大雨點小的競爭對手,AI 產品銷路最好的卻是那個最低調的公司——亞馬遜。亞馬遜的數據中心爲數千公司提供雲服務,它的 Echo 智能音箱在美國上市兩年,銷量打破 500 萬,獨立開創了一個全新的產品品類。但近年來亞馬遜似乎比蘋果還要重視保密,常常對它的 AI 研究三緘其口,而蘋果已經在今年早些時候開放了它的機器學習項目。不過,最近亞馬遜首席科學家兼 Alexa 項目副總裁 Rohit Prasad 接受了外媒採訪,對 Alexa 語音識別和自然語言理解上的技術進展,和智能家居 AI 的前景,做了詳細闡述。
亞馬遜 Alexa 首席科學家兼副總裁 Rohit Prasad
對於不瞭解 Alexa 的讀者,它是亞馬遜明星產品 Echo 上搭載的智能語音助手,更確切的說,是「人機交互平臺」,可看作是亞馬遜的 「Siri」。
四天前,Rohit Prasad 在拉斯維加斯的亞馬遜網絡服務大會上,發佈了:
改進的 Alexa 工具箱(Alexa Skills Kit),以幫助開發者們爲 Alexa 平臺開發軟件應用;
大幅提高的 Alexa 語音服務,更加容易得把冰箱汽車之類的第三方設備,變爲受 Alexa 控制的「機器人」;
亞馬遜與英特爾的合作;
Alexa 加速項目,通過初創孵化器 Techstars 運營 13 周的培訓,幫新人熟悉 Alexa 的功能。
發佈會之外,Rohit Prasad 接受了外媒記者 Steven Levy 的採訪,對 Alexa 項目的未來發展方向作了詳細說明。採訪內容如下:
Steven Levy:你是 Alexa 的副總經理,請告訴我 2016 年的項目進展。
Rohit Prasad: 我們對現在的市場反響十分滿意。今年我們發佈了幾個新設備,並且進入新的國際市場。在訓練 Alexa 更好地理解用戶上面,我們有了巨大進步——不管是 Alexa 的服務範圍,還是搜索內容的精確度。比方說,在音樂領域,Alexa 有了新的能力,讓用戶能根據歌詞搜索並播放歌曲。最後,Alexa 的第三方的功能軟件以驚人的速度增加,早些時候只有幾百個,現在達到 5000 個左右。
你們對Alexa平臺的期望是什麼?Echo 僅僅是接受用戶的命令,還是會成爲我們聊天說話的伴侶?
Alexa 已經提供了一系列的功能和體驗,對用戶的幾種單次表達意圖有極高的識別率。在對話方面,我們認爲把這做好需要做很多妥協。Alexa 不應該問你不相干的問題,這會讓用戶很煩。但有些問題 Alexa 又必須要問。能夠與用戶談話的能力確實非常重要。你知道 Alexa 大獎賽嗎(Alexa Prize competition)?
你說的是九月宣佈的,對計算機專業學生獎金 250 萬美元的挑戰?
沒錯。在學術界進行人機對話研究十分困難,他們沒有 Alexa 這樣的系統。所以我們把一個改版的 Alexa 工具箱提供給他們,讓對話功能的研發更加容易。完成這項超級挑戰需要:開發一個社交機器人,要能和人進行有意義、連貫、並且有吸引力的對話。
你認爲這會是一個圖靈水平的人機對話嗎?
不會,圖靈測試取決於人的輕信—— AI 是否能欺騙一個陌生人,讓其相信它是一個人?在一些特定任務上,Alexa 已經比人類強得多。讓人在數百萬音樂目錄裏找出一首歌是極度困難的,對吧?讓 Alexa 計算六十次方,人也沒法比。所以我們絕對不想讓 Alexa 成爲圖靈測試那樣的 AI (這意味着把它的一些能力降低到人類水平)。這更多是連貫性和可參與性的問題。
在 20 分鐘的挑戰時間中,測試者們會和 Alexa 說些什麼呢?
我們會給出一些話題,比如說,「你能說說今天報紙的流行話題嗎?」我們希望社交機器人能夠在科學發明或者金融危機這樣的話題上能和你交談。
你們收到很多報名了嗎?
極其得多,幾百個接着幾百個地來。我們還在向大學生們提供資助——因爲參與挑戰的研究生和博士生們要在學業之外花費時間,除非是最理想的情況——該挑戰和他們課程的研究高度一致。所以我們想確保他們在高難度的語音應用研究上得到資助。我們收到那麼多申請,以至於一開始無法決定十個資助名額該給誰,最後我們資助了十二隻團隊。
由於大公司對傑出 AI 和機器學習人才的巨大需求,有人擔心學界會流失他們的核心人才。
這是一個需要考慮的問題。這也是我建立 Alexa 大獎賽的動機之一。我們希望培養下一代機器學習和 AI 的人才,學術圈會起到重要作用。我認爲如果所有教授都去爲公司效力將是很短視、很可怕的。
但你們很明顯在僱傭 AI 人才,與谷歌、微軟、蘋果、Facebook 甚至傳統企業進行人才競爭。你們用什麼吸引那些人才來亞馬遜工作呢??
我不認爲我應該回答這個問題,其它公司會複製。
但是,如果你回答得好,人們也許會看到然後申請去亞馬遜工作。
在亞馬遜這樣的公司做研究的好處是:數據和計算性能的結合。世界上最聰明的頭腦都來這兒,一起解決用戶面臨的問題。研究怎麼解決用戶實際問題並不會減少創新,事實上這加速了創新。在亞馬遜,我們想要解決的問題都超級難。 在 Alexa 剛開始的時候,解決語音識別和自然語言理解問題跨越了許多領域,這顯然就是一個非常難的問題。
今天你們發佈了幫助開發者的新工具,是嗎?
是的。其中兩項我們想爲開發者簡化的問題是「內置意圖」(built-in intent)和「位置種類」(slot types)。
請解釋。
大多數功能中,人們想說「ALexa,停下」或者「ALexa,取消命令」。你希望這些命令或者意圖被開發者們照顧到,而不需要告訴他們開發這樣的定製功能。「位置種類」是類似於城市名稱、詞彙這樣的東西。我們之前做了很多這樣的東西,有十個意圖和「位置」是開發者們經常用到的。作爲第三方開發技能,我們發佈了有幾百個內置功能的工具箱——它橫跨多個領域的「位置種類」,比如書、視頻和本地經營,還有一系列的意圖來幫助回答人們問 Alexa 的問題。
換句話說,如果我是開發者,我可以靠內置的詞庫和同義詞解釋,來讓我的功能更智能。而且可以做更多。
的確如此,它給你的交互技術一個更好的起步。我們以開發者預覽的形式發佈它,有兩點原因:1. 我們希望瞭解人們在意圖中是怎麼使用這些東西的,這是由於我們對這些意圖和種類如何使用有一個明確的思維模型。但是開發者也許有不同想法。消費者們也可能有不同想法。2. 我們希望得到開發者們的反饋,並不斷改進。我們會不斷增加新內置功能。
目前,當用戶喚醒了Echo 的某個技術,Alexa 的思維會在某種程度上轉移給開發者的 app 。看起來,你們今天做的這些東西是爲了建立一個 Alexa 詞庫和執行方式的標準,讓開發者們能夠直接利用,是這樣嗎?
你說的完全正確。這創造了一個共同的詞庫,幫助分享和改進 Alexa。開發者們可以整合這些功能所以他們不需要再做一遍同樣的工作。
對我來說,使用 Alexa 的問題是它的功能太多。一般來說,你需要知道一個功能的存在來觸發它,現在已經有了 5000 個功能並且還在不斷增加,用戶們怎麼跟得上呢?
我們絕對希望 Alexa 能通過第三方應用告訴你怎麼做,即使你並不知道相關功能。我們還沒有試過這個,但這絕對在我們的路線圖上。建立一個共同的詞庫能幫助我們走到那一步。
亞馬遜並不是唯一一家用 AI 打造交互式對話平臺的公司。你們的方法獨特在哪?
沒有手部控制是關鍵,這是語音的王牌應用。如果你說的「獨特」指的是 Alexa 和 Echo,我們並沒有試圖逃避無屏交互難題(內心大吼:它們沒有屏幕!)。在「談話交互應該怎麼是什麼樣子」這個問題上,我們的想法在一開始就和其它公司不一樣:它不應該和智能手機一個樣,它是一個應對專門場景的設備,而且不會有屏幕。我們必須解決這個難題。
那些擔心時刻開啓的麥克風所帶來的隱私風險的用戶呢?對於「天啊,亞馬遜一直在聽我說話」這樣的用戶,你們怎麼說?
隱私非常關鍵,我們一直在該問題上十分透明。亞馬遜雲平臺並沒有一直在聽你的動靜,那只是 Echo 設備。而且 Echo 起到的是「探測」作用,它不是一個識別所有詞語的的識別裝置。它在探測用戶是否說了 「Alexa」(讓 Echo 執行命令需要對它喊「Alexa」)。只有它確信用戶對它說了「Alexa」的時候,我們纔開始用到雲端。
Alexa 會變得像 Google Now 或者 Apple 消息通知那樣主動嗎?比方說,當它聽見我在房間裏瞎搞,它會提醒我該出門了,不然今天的會面我會遲到?
我們確實想過這點。但 Echo 沒有屏幕,實現該功能會有一些挑戰。對於任何涉及信息通知的功能,我們希望把它做成該做的樣子。現在還不能透漏我們採用的方式。
目前,人們不得不爲他們的智能助手選擇一種談話交互方式(某一家公司的 AI 系統)。有朝一日,我們能否看到 Alexa、微軟小冰,Google Home, Samsung Viv 或者其他任何 AI 系統相互協作呢?
對於這類對話裝置來說,現在還很早。我看到這類技術已經超過 20 年了,現在仍感覺 Alexa 和 Echo 是革命性的東西,尤其在交互上。我認爲這(多 AI 協作)需要將來再說。每個公司都有不同的一套東西,你可以未來想象將會有多套 AI 系統。至於它們之間能否協作,現在還不能判斷。
Echo 智能音箱, 和它的 Alexa 技術,對大多數普通消費者來說是新奇事物。一開始人們還以爲這是亞馬遜一種快速購物的方式。現在它已經成爲亞馬遜最受歡迎的產品之一,並且是一個非常重要的平臺,你們的項目使命有沒有發生變化呢?
我不會這麼說。基本上,我們仍然在做着三年前我們所說的、應該做的事。只不過現在要讓 Alexa 在用戶面前變得更有魔力。
via backchannel
【招聘】雷鋒網(公衆號:雷鋒網)堅持在人工智能、無人駕駛、VR/AR、Fintech、未來醫療等領域第一時間提供海外科技動態與資訊。我們需要若干關注國際新聞、具有一定的科技新聞選題能力,翻譯及寫作能力優良的外翻編輯加入。工作地點深圳。簡歷投遞至 guoyixin@leiphone.com 。
相關文章: