2018年3月21日,格蘭研究舉辦了中國(guó)智能語(yǔ)音業(yè)務(wù)集成發(fā)展峰會(huì),從原有的機(jī)頂盒、智能電視等視頻終端等領(lǐng)域的研究拓展到了智能終端、智慧家庭領(lǐng)域,借助此次機(jī)會(huì)格蘭研究發(fā)布了《中國(guó)智能語(yǔ)音業(yè)務(wù)與應(yīng)用發(fā)展白皮書(shū)》(以下簡(jiǎn)稱(chēng)《白皮書(shū)》),《白皮書(shū)》從語(yǔ)音技術(shù)發(fā)展、語(yǔ)音音箱市場(chǎng)、語(yǔ)音應(yīng)用現(xiàn)狀、影響語(yǔ)音業(yè)務(wù)應(yīng)用發(fā)展的因素幾個(gè)方面主要闡述了國(guó)內(nèi)外智能語(yǔ)音音箱的發(fā)展。
語(yǔ)音技術(shù)提供商在不斷發(fā)力,為智能終端產(chǎn)品升級(jí)提供有力支撐。目前國(guó)內(nèi)多數(shù)語(yǔ)音廠商的在安靜狀態(tài)下的語(yǔ)音識(shí)別準(zhǔn)確率大都達(dá)到95%以上,支持5米遠(yuǎn)場(chǎng)交互,如今均在向非標(biāo)準(zhǔn)環(huán)境下提高遠(yuǎn)場(chǎng)識(shí)別準(zhǔn)確率、降低誤喚醒率及響應(yīng)速度的方向發(fā)展。
語(yǔ)音識(shí)別技術(shù)的發(fā)展促使語(yǔ)音終端市場(chǎng)百家爭(zhēng)鳴。人工智能技術(shù)在2017年席卷全球,其中語(yǔ)音識(shí)別技術(shù)的發(fā)展帶動(dòng)了音箱市場(chǎng)的發(fā)展,語(yǔ)音智能終端的發(fā)展使得產(chǎn)品的推出速度不斷加快。自從2014年亞馬遜推出Echo后,國(guó)內(nèi)眾多企業(yè)涌入語(yǔ)音智能音箱市場(chǎng),語(yǔ)音智能音箱品類(lèi)也在逐年遞增,2015年叮咚智能音箱進(jìn)入市場(chǎng)后,其他品牌語(yǔ)音智能音箱開(kāi)始涌入,2016年有4款語(yǔ)音智能音箱推入市場(chǎng),2017年下半年更是呈現(xiàn)出爆發(fā)式增長(zhǎng),密集發(fā)布10余款語(yǔ)音智能音箱新品。
圖表 1 國(guó)內(nèi)外智能音箱發(fā)布情況示意圖
國(guó)內(nèi)智能語(yǔ)音音箱skills實(shí)現(xiàn)方式主要包括互動(dòng)式、指令式、播放式三種。用戶(hù)喚起工具達(dá)成事務(wù):設(shè)備在這里模式中,是用戶(hù)和生活服務(wù)的連接橋梁。解放雙手,通過(guò)語(yǔ)音就能控制家居、發(fā)送短信、叫外賣(mài)等等。設(shè)備為用戶(hù)提供內(nèi)容:設(shè)備在這里模式中,扮演的是聯(lián)網(wǎng)音箱的基礎(chǔ)功能,將音樂(lè)、新聞、菜譜等內(nèi)容推送給終端用戶(hù)。用戶(hù)和設(shè)備多輪交互:不再是指令式和播報(bào)式,而是和設(shè)備的多輪對(duì)話(huà)。主要用于在娛樂(lè)領(lǐng)域,如問(wèn)答測(cè)試、情景探險(xiǎn)、試圖對(duì)話(huà)、聽(tīng)音唱歌等功能。