目前市場上出現(xiàn)的智能音箱,價格上下浮動的空間非常大,從蘋果HomePod的349美元(折合人民幣約2200元),到天貓精靈打折時的99元,各家音箱的定價策略有著巨大的區(qū)別??梢钥吹?,現(xiàn)在幾乎大多數(shù)智能音箱的價格都集中在399、499、599的價格上,作為一臺音箱,這個價格可以說非常“互聯(lián)網(wǎng)”了。
而這樣定價的目的也非常明顯,那就是快速積累更多原始用戶,將自家在行業(yè)中的影響力推廣出去、放大,占據(jù)這一未來的“流量入口”。隨著人工智能的不斷發(fā)展,誰能夠搶占智能音箱市場,就能通過語音交互系統(tǒng)掌握整個智能家電市場、完成對智能家居的布局不僅僅意味著廠商對智能家居的掌控,更能夠通過智能交互系統(tǒng)掌握更多消費習慣,這里面蘊藏的是一個巨大的金礦。
智能家居與其說是連接的革命,不如說是交互的革命。那么,語音交互是否有望提高智能家居用戶的接受度呢?一切并沒有想象中的簡單,智能生活方式的普及還有很長一段路要走。眾所周知,如今的智能家居產(chǎn)品面臨著消費者不買賬的尷尬窘境。究其原因:消費者認為如今的智能家居產(chǎn)品操作過于復雜,戴著“偽智能”的帽子,導致用戶體驗不佳。此外,語音交互系統(tǒng)還面臨著許多技術性難題,例如語音交互的“智能化”和“人性化”。
從當前的語音識別技術發(fā)展看來,基礎理論和技術框架已經(jīng)基本成熟,目前主要是基于深度神經(jīng)網(wǎng)絡的識別架構,再加上大規(guī)模的真實數(shù)據(jù)訓練。目前在手機端的近講語音識別錯誤率可以做到3%以內,在電話語音識別錯誤率可以做到6%以內,基本上接近或超過人工識別的水平。語義理解和知識圖譜等認知技術,目前還沒有形成通用的技術框架,主要是針對具體垂直領域進行優(yōu)化,這部分有待突破性進展。
目前,近場識別技術目前已經(jīng)比較成熟,現(xiàn)在手機上使用的語音輸入功能就屬于近場識別技術,用戶必須在離手機比較近的距離內說話,但在智能家居環(huán)境中,用戶和智能終端之間的距離被大大增加了,用戶能隨意用語音控制智能家居的一個必要條件就是在無論你在客廳哪個角落發(fā)出指令,設備都能準確的識別,語音識別技術必須突破距離的障礙。
此外,現(xiàn)在的物聯(lián)網(wǎng)設備,大到汽車、空調、機器人,小到玩具、穿戴設備等,有大有小、有帶屏幕和不帶屏幕、涉及不同的應用領域,交互方式差異非常大,需要針對性優(yōu)化語義理解和知識圖譜。
語音交互是否是智能家居最理想的實現(xiàn)方式?有待商榷,智能家居更理想的實現(xiàn)方式是無需用戶參與控制,依靠大數(shù)據(jù)實現(xiàn)智能云平臺自動學習和感知用戶的需求和習慣,自動控制所有涉及的設備。這是一個設想,在技術未歸位前,也許語音聲控是智能家居現(xiàn)階段最佳實現(xiàn)方式。