語音和機器視覺技術並駕齊驅,極限元深耕三大行業

 2017-06-05 21:31:00.0

雷鋒網【新智造】按:在語音領域,國內除了科大訊飛獨佔鰲頭外,思必馳和雲知聲等創業公司處於行業領先的位置,極限元智能科技創始人雷臻認爲他們在技術與之處於同一梯隊,只是在行業應用方面有所差異。極限元以語音技術起步,但不僅限於此。爲了給客戶提供一站式解決方案,他們又涉足機器視覺。目前,他們在泛娛樂等三大行業進行着深度挖掘。

極限元智能科技也是「新智造成長榜 2017」的報名企業,本篇爲雷鋒網(公衆號:雷鋒網)新智造對極限元創始人雷臻的採訪,主要講述了極限元的業務板塊、發展狀況以及雷臻的創業經歷。

「我們的業務主要還是 To B,To C 我們在做一些嘗試,但是現在還沒有。To B 客單價很高,忠誠度高;To C 客單價相對比較低,忠誠度低,這是兩種完全不同的思路。你用一個團隊去做兩個的話,很容易把力量分散了。」 極限元智能科技 CEO 雷臻一開始告訴雷鋒網新智造他們的業務模式,這周他在外出差,也主要與幾家 B 端企業談合作項目。

語音和機器視覺技術並駕齊驅,極限元深耕三大行業

極限元智能科技創始人雷臻

極限元成立於 2014 年 8 月,致力於發展人工智能技術,主要爲行業用戶提供智能交互式語音技術和機器視覺等整體解決方案。不過,極限元團隊剛成立時是以語音技術起步的,包括團隊技術合夥人康利強等人在語音行業都有諸多積累。他們的語音技術主要包括語音識別、語音合成、聲紋識別和語音檢索等,雷臻認爲,在語音行業,他們是爲數不多具有完整語音產業技術的人工智能公司。與同行業裏的雲知聲和思必馳等公司相比,「至少在技術方面我們處在同一梯隊」。

極限元與這些公司的不同之處主要是在行業應用上,雷臻介紹說,極限元目前專注在智能安全、智能教育和泛娛樂這三大領域做深度挖掘。

在智能安全領域,極限元已跟國家網信辦和公安部門進行合作,通過語音技術識別政治言論、暴力、恐怖和詐騙等有害信息。比如在詐騙電話中,聲音的特徵和規則都是固定的,通過極限元的語音檢索技術,就可以判斷電話通話的聲音是否爲詐騙音。

在智能教育方面,極限元主要提供語音測評服務,包括中小學生的古詩詞誦讀測評和英語測評,能夠將學生的發音和韻律通過與標準音比對,來幫助其提升發音準確度。目前,極限元跟語文出版社合作研發了兩款 APP,其前臺交互和後臺技術都由極限元提供。

泛娛樂行業是極限元從去年年底纔開始佈局的,他們主要利用語音識別技術來達到交互目的。比如在直播中,主播說一些特定關鍵詞命令,通過語音識別就可以產生一些交互效果,從而增強娛樂性和用戶黏性。不過,由於泛娛樂對交互性要求比較高,極限元也使用了機器視覺技術,以此識別主播的「特定手勢(心型和抱拳等)」,在後臺產生動畫特效。由於兩種技術的支撐,這樣他們就提供了一個具有競爭力的解決方案,直播平臺、經紀公司和網紅主播都可以使用。雷臻表示他們在這一行業的進展不錯,「最近要籤幾個單」。

泛娛樂領域的鑑黃市場競爭則十分激烈,包括阿里綠網和騰訊萬象優圖等人工智能團隊都已佔據了大量市場份額,極限元也加入了這片紅海的爭奪戰中。鑑黃主要涉及到圖像識別、語音識別和文本挖掘等技術,雷臻表示雖然在技術層面上各個團隊相差無幾, 但市場講求「先入爲主」。即便如此,他認爲這些團隊只是搶先佔據了一些市場,而極限元在服務等方面也都不差,他們還有機會分一杯羹。

除了在泛娛樂等行業的應用外,極限元還有三維虛擬聽覺設備、互聯網有害音視頻監測系統和車載疲勞駕駛檢測儀等產品推出。在車載疲勞駕駛方面,極限元通過採用人臉、姿態和語言等多項人體特徵作爲判斷標準,基於大量數據訓練,對疲勞駕駛場景進行監測。「我們通過攝像頭檢測你的面部,通過面部狀態和我們的模型進行對比,然後分析你是處在疲勞狀態還是正常狀態,如果處在疲勞的狀態機器就會提醒你。」雷臻說道。

實際上,這些行業應用都需要用到機器視覺技術,雷臻表示現階段極限元爲客戶做基於閉環的解決方案,所以他們在機器視覺和語音識別技術上的投入度一致。另一方面,語音技術和機器視覺技術在算法等方面有諸多相似的地方,視覺部分做起來也比較順手。

當問及是否會向醫療和家居等其他領域擴張時,他表示極限元暫時還沒有這種打算。

創業公司最怕的就是擴張太快,人力資源和資金都是有限的。現在所涉及的三大領域都是朝陽產業,而且每一個領域深耕下去,都是百億的市場。但你鋪的太開就變成哪個點都不精,這是沒有太大意義的。我們是先把這些領域做好,包括數據和人才積累足夠了之後,可能纔會去考慮其它領域。

同時,他說這些領域暫不觸及也是因爲有很多「坑」,「看起來很美好,但是真正做的話就不一定了」。

跟同行業的競爭者相比,雷臻認爲,技術門檻本身是一方面,更重要的是他們願意在這三大領域紮根進去,並積累了數據和人才,加深了對整個業務流程的理解,「至少在在泛娛樂方面比他們強太多了」 。他進一步解釋說,在這些領域,其他公司大都只是提供一個技術方案,提供一個基本功能,極限元則提供針對端到端的解決方案。他用沃爾瑪的競爭力舉例:當別人逛完了一個商場,還會再逛另外一個商場。但沃爾瑪就是一站式購物,我有那麼多不錯的解決方案,你根據情況進行選擇,我們可以根據你的業務做一些深度定製。

對於極限元目前的發展,雷臻表示團隊愈加成熟,公司發展狀態趨好。去年,他們實現了盈虧平衡,營收達上千萬級,符合公司發展的基本目標,但他們還有挑戰目標,以團隊的實力,他認爲應該能做得更好。在未來一到三年,他希望公司能在三大業務板塊中成爲最一流的人工智能解決方案提供方。

據瞭解,極限元團隊目前 50 多人,今年預計會增加到 70 人。B 端合作方包括 360、搜狗和騰訊等企業共四五十家。極限元已於去年完成了天使輪 4000 萬融資,新一輪融資他們希望能接洽一些在業務方面有資源的基金。

此外,雷鋒網新智造瞭解到,雷臻還是全球最大的比特幣交易平臺 OKCoin 的聯合創始人。OKCoin 創立於 2013 年 6 月,目前有近 300 人,7*24 小時爲用戶提供服務,辦公區域與極限元智能科技僅一牆之隔。

進入比特幣這個異常火爆的市場不久,他隨即就成立了極限元,進軍人工智能行業。就行業發展趨向而言,作爲創業者,他的嗅覺變得異常敏銳。其次,區塊鏈技術和人工智能技術本質上也有很多相似的地方,而且基於他和合夥人在人工智能多年的技術積累,這次創業就更是順理成章。

不過,他早前創業卻歷經坎坷,當初由於在創業方向和管理經驗等各個方面存在不足,跟朋友做過的 WAP 社區「haodewap」和手機優惠券兩個項目都以失敗而告終,這是他最困難的一段時期。

但經過這麼多年創業的磨礪,也讓他對創業本質的理解更加深刻,包括在找人、找錢、找資源和找方向上,所考慮的問題更加全面了。也有很多在思想意識上的積極變化,雖然不能用準確的語言表述,但這些都在潛移默化中重塑了他如今的心境。因爲經歷過失敗的考驗,抗壓能力自然強於常人。即使現在也會面臨困境, 「一般來說,我都看的比較淡」,他說。

雷鋒網正在啓動「新智造成長榜2017」評選活動,我們將對人工智能與機器人行業進行大規模報道、梳理和調研,並聯合數十家著名投資機構根據這些創新公司的技術實力、商業能力和成長性進行深度評選,最終從多個領域分別選出一些極具潛力成長性的創新公司。如果你想參與我們的評選,可點擊「報名」鏈接,或通過郵箱xinzhizao@leiphone.com聯繫我們!

文章來源:雷鋒網