人工智能技術(shù)浪潮的來襲,將我們帶進萬物相連的物聯(lián)網(wǎng)時代。新的時代下,語音交互成為了人機交互的新方式,幾乎所有的硬件產(chǎn)品都打出了“語音交互”這張牌。語音作為人類最自然的交流方式,比文字和圖像更具天然的優(yōu)勢。公開數(shù)據(jù)顯示,2018 年,30%的人機交互將通過語音完成;2020 年,至少 50%的搜索將是語音搜索。語音交互作為人機交互的重要演進方向,正在逐步深入到我們的日常生活和工作應用中去。
語音交互風頭正勁,各大巨頭都不想輸在起跑線上。為了爭奪這一入口,巨頭們在語音交互領(lǐng)域大力布局,展開了一系列的瘋狂競賽。蘋果Siri,谷歌Assistant,微軟Cortana,亞馬遜Alexa紛紛拓展生態(tài)系統(tǒng),積極推出自己的語音產(chǎn)品,加大對語音交互市場的爭奪。
Home
2014年11月6日,亞馬遜發(fā)布搭載語音助手的音箱Amazon Echo,不止局限于音樂播放,內(nèi)置的Alexa語音交互系統(tǒng)還能進行智能家居設備控制。而谷歌隨后發(fā)布的Google Home,一直在與Echo爭搶home場景的中樞角色。國內(nèi)包括京東、阿里等巨頭都在布局Echo 類產(chǎn)品。萬萬沒想到,在《碟中諜4》中,阿湯哥通過用語音來開燈、開電視的生活場景,被搬到了現(xiàn)實生活中來。
Car
語音交互是輔助駕駛的最好交互方式,這也使得汽車上的語音產(chǎn)品成為兵家必爭之地。數(shù)據(jù)顯示,在美國,平均每四起因使用手機導致的車禍事故中,就有一起是開車時手持接打電話引起的。我們知道,最安全的駕駛姿勢,一定是目視前方、手握方向盤,語音交互在car場景的應用,釋放了駕駛員的手和眼睛,讓駕駛員專注于眼前的路況。特斯拉可謂語音交互在駕駛場景應用的鼻祖,語音控制系統(tǒng)的加入給汽車這個古老行業(yè)帶來了朝氣。之后,蘋果在Apple CarPlay內(nèi)置Siri實現(xiàn)了語音交互,國內(nèi)語音廠商科大訊飛,為汽車提供語音交互系統(tǒng),其中有寶馬、雷克薩斯這樣的豪華品牌。
(特斯拉汽車)
On the go
在科幻電影《Her》中,男主戴著小巧的無線耳機,不論上下班、逛街,還是去海邊,都可以隨時與耳機內(nèi)置的語音助手對話,甚至談起了戀愛。現(xiàn)實生活中,和語音助手談戀愛目前是不可能的,但不能否認,小巧的智能無線耳機,確實給外出出行帶來了便利。正是瞄準了人們on the go場景下對方便的需求,智能耳機出現(xiàn)了。2016年蘋果推出airpods無線耳機,用戶通過藍牙連接手機之后,借助Siri語音交互系統(tǒng)操作手機。而國內(nèi)推出的Vinci智能耳機,作為一款集耳機和播放器于一體的獨立設備,甚至不需要連接手機,喚醒語音助手小me后,語音控制實現(xiàn)音樂播放、電話接打、心率查詢、收聽新聞等服務。語音交互省去了用戶手動操作繁瑣的步驟,給戶外出行帶來了便利。
(Vinci智能耳機)
誰更具市場潛力
按照距離麥克風的遠近,以上三種語音交互的場景,可分為兩類:一是遠場語音(在車載、智能家居環(huán)境下,離麥克風3-5米),二是近場語音(嘴巴貼近麥克風,與產(chǎn)品對話)。
Amazon Echo系列產(chǎn)品在2016年賣出了超過650萬臺,可謂遠場語音的典范。亞馬遜將語音交互落地到智能家居上,加入麥克風陣列,對不同方向的聲音信號進行處理,解決了部分遠場化的問題,但是由于定向拾音的角度有限,說話人的移動成為問題。亞馬遜Alexa負責人 Toni Reid認為,“當用戶下達語音指令后,Alexa實際上只有一次機會去部署相應的動作,而不能去和用戶進行多輪對話,反復對話對用戶來說是很糟糕的體驗。”
2011年iPhone 4s發(fā)布Siri語音助手,是蘋果在語音交互棋盤上下的第一顆棋子,之后Siri不斷迭代,但在遠場語音方面,Siri比不上ALexa。因此,蘋果選擇以近場語音交互為主的airPod為切入點發(fā)力,這一舉措鞏固了蘋果在近場語音中的王者地位。數(shù)據(jù)顯示,airpods上線短短一個月,就異軍突起占據(jù)了美國無線耳機26%的市場份額。
相比音箱,耳機的利用率更高。智能家居、車載語音產(chǎn)品,要依托一個固定的環(huán)境,從這一點來看,以智能耳機為代表的近場語音產(chǎn)品更個人化。遠場語音下,用戶總是要保證聲源距離,才能完成語音交互,若聲源距離較遠,音量不夠大,那語音識別率將會大受影響。戴在耳朵上的智能耳機,離人的語言器官嘴巴近,當你和耳機進行語音交互的時候,更像是和朋友交談。這就如同大聲嘶喊和兩個人竊竊私語。
耳機的攜帶方便,決定了它有更多自然的使用場景。以電腦和智能手機為例,當電腦發(fā)展成為基礎(chǔ)設施走入千家萬戶,幾乎人手一臺,用戶長時間大規(guī)模的使用;后來,幾乎兼容電腦的智能手機,擴充了傳統(tǒng)手機的使用范圍,并且體積輕小攜帶方便,用戶量迅速擴展,人們自然而然的從PC時代邁入智能手機時代。
MSR首席研究員、語音專家俞棟指出,“目前一般遠場識別的錯誤率是近場識別錯誤率的兩倍左右”,當產(chǎn)品真正落地的時候,近場語音帶來了更好的用戶體驗。
去年,“互聯(lián)網(wǎng)女皇”的瑪麗·米克爾發(fā)布的2016年互聯(lián)網(wǎng)趨勢報告中,談及“語音正在被重塑,成為人機交互的新方式,在過去75年里,每10年就有一次人機交互的重大革新,人類對機器的操作,從物理手柄按鍵,到物理鍵盤鼠標,再到觸摸屏,現(xiàn)在語音成為了重要的交互方式。”在這場語音交互入口爭奪戰(zhàn)中,以智能耳機為代表的“on the go”場景語音產(chǎn)品,因為更接近語言交流的器官,應用場景更廣泛,或?qū)⒊蔀檎Z音交互的最大入口。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...