吼一吼就可登App?近日,云知聲聲紋登錄系統(tǒng),成功率可達(dá)99%。與智能語音先行者科大訊飛相似,兩家公司創(chuàng)始人師出同門。
除了專業(yè)的語音技術(shù)廠商,互聯(lián)網(wǎng)科技巨頭也紛紛涌入語音賽道中來。2月20日,在小米的新品發(fā)布上,小愛觸屏音箱亮相,而在這兩天前,騰訊也出面澄清,聽聽(音箱)一直在正常研發(fā)和銷售運(yùn)營(yíng),面向行業(yè)輸出全棧語音人工智能解決方案能力。
智能語音被譽(yù)為人工智能皇冠上的“明珠”,近段時(shí)間以來熱度不減,隨著深度學(xué)習(xí)技術(shù)的突破,大數(shù)據(jù)技術(shù)以及自然語言理解能力的提升,帶動(dòng)了一波產(chǎn)業(yè)熱潮,除了在教育、客服、電信等傳統(tǒng)行業(yè)之外,還開辟出了車載、家居、醫(yī)療、智能硬件等語音技術(shù)應(yīng)用新天地。
“聽懂”人話,語音方案“百花齊放”
走進(jìn)廣州迅羽通信技術(shù)公司的客服中心,敲擊鍵盤的聲音不再此起彼伏,客服人員更多在傾聽和安靜地回復(fù)來電。
迅羽先后承運(yùn)了香港快運(yùn)、電訊盈科、和記電訊、東亞銀行、亞航以及廣東省12348司法、廣東電力與國(guó)稅熱線等國(guó)內(nèi)外超大型客服服務(wù)。一直以來,傳統(tǒng)的客服呼叫中心是勞動(dòng)密集型產(chǎn)業(yè),由于內(nèi)地人力成本優(yōu)勢(shì),香港一些電信業(yè)、銀行業(yè)、航空業(yè)等將呼叫中心外包,但隨著人力成本的提升,呼叫中心的利潤(rùn)進(jìn)一步被壓縮。
從去年9月起,迅羽聯(lián)合哈工大共同成立人工智能自動(dòng)問答技術(shù)研發(fā)實(shí)驗(yàn)室,著手引入AI。經(jīng)測(cè)算,有七成動(dòng)作是可替代的——客服人員大部分時(shí)間都在文字錄入和反復(fù)確認(rèn),而如今,每當(dāng)客戶一報(bào)完身份證號(hào)碼、家庭地址等信息時(shí),就已經(jīng)自動(dòng)錄入系統(tǒng),而客服人員則可專注聽取客戶的反饋。在臺(tái)風(fēng)等極端天氣下,面對(duì)激增的訂改機(jī)票業(yè)務(wù)也更從容,避免了人員配備過多。
機(jī)器能“聽懂”人話,已經(jīng)深入各種場(chǎng)景??拼笥嶏w與上海高院合作的刑事案件輔助辦案系統(tǒng)投用后,目前已開始在全國(guó)范圍內(nèi)擴(kuò)展,輔助辦案系統(tǒng)有望在國(guó)內(nèi)法院系統(tǒng)全面鋪開,并向更多罪種、民商行政案件等方向延伸,截至今年初,審訊產(chǎn)品于法庭拓展迅速,已覆蓋815個(gè)法院、4200個(gè)法庭。
陪你聊,陪你跳,會(huì)管家,會(huì)傳情……深圳狗尾草智能科技公司不僅推出了呆萌又暖心的情感社交機(jī)器人,還打造出全球首個(gè)3D全息AI虛擬生命“琥珀”,在日趨白熱化的語音市場(chǎng)中走出了一條差異化道路。
“幫我調(diào)下明天上午7點(diǎn)的鬧鐘。”語音識(shí)別距離大眾并不遙遠(yuǎn),在移動(dòng)終端上,用戶可以實(shí)現(xiàn)手機(jī)讀短信、介紹餐廳、詢問天氣、語音設(shè)置鬧鐘等,智能音箱更被認(rèn)為是控制智能家居的自然入口,從“百箱大戰(zhàn)”到現(xiàn)在的語音方案“百花齊放”,互聯(lián)網(wǎng)平臺(tái)商、語音技術(shù)硬件服務(wù)商、內(nèi)容和云服務(wù)商、芯片商等,都相繼推出了各自支持設(shè)備智能化升級(jí)的方案。
不是替代人,而是更好發(fā)揮人的價(jià)值
通過人工智能語音交互,機(jī)器不僅能聽懂人話,還能更好地發(fā)掘人的價(jià)值。
通過匯聚學(xué)生的家庭作業(yè)、課堂訓(xùn)練數(shù)據(jù),科大訊飛用語音識(shí)別對(duì)內(nèi)容進(jìn)行語義理解分析,判斷作業(yè)對(duì)錯(cuò),提供改進(jìn)方案。“人工智能+大數(shù)據(jù)結(jié)合因材施教,比如同一個(gè)班學(xué)生對(duì)內(nèi)容接受度是不一樣的,每個(gè)人的知識(shí)點(diǎn)情況掌握又是怎樣的,單個(gè)學(xué)生上一個(gè)知識(shí)點(diǎn)有沒有掌握,都可以有針對(duì)性地改進(jìn)。”科大訊飛高級(jí)副總裁杜蘭說。
杜蘭說,AI賦能教育產(chǎn)業(yè)不是要取代老師這個(gè)職業(yè),而是可替代批改等瑣碎事務(wù),解放老師更多時(shí)間。
迅羽副總經(jīng)理黃勉超也同樣認(rèn)為,AI的出現(xiàn),并不是要用機(jī)器人來取代人,而是與機(jī)器有更好分工,“有一半用戶是帶著情緒或投訴打進(jìn)電話來,但如果他們面對(duì)的是一臺(tái)毫無表情的機(jī)器,只會(huì)繼續(xù)帶著憤怒掛掉電話”。
黃勉超還發(fā)現(xiàn),引入AI后,客服業(yè)務(wù)有了更多科技含量,品牌形象大為提升,公司在招人時(shí)也更有底氣,“以前這行業(yè)的人會(huì)覺得,大好青春就在這1平米的格子間日復(fù)一日從事簡(jiǎn)單枯燥的事情,他們會(huì)覺得沒有前途,而現(xiàn)在工作沒有那么枯燥后,人員流動(dòng)沒有那么頻繁,而且人員培訓(xùn)周期也大為縮短,新手很快就可以進(jìn)入角色,在整個(gè)過程中,人的價(jià)值就發(fā)揮出來了”。
向B端發(fā)力,與產(chǎn)業(yè)結(jié)合構(gòu)筑生態(tài)
盡管智能音箱大戰(zhàn)火熱,但不少人始終認(rèn)為,目前AI產(chǎn)品尤其是語音產(chǎn)品還只是一種年輕人的科技玩具,實(shí)用性并不強(qiáng)。
狗尾草創(chuàng)始人、CEO邱楠對(duì)此表示,任何一個(gè)代表未來方向的科技類產(chǎn)品的流行,比如手機(jī)、電腦、智能手表等,一定是從年輕人開始。年輕人對(duì)AI有想象力,他們知道自己需要的場(chǎng)景是怎樣的。盡管現(xiàn)有AI技術(shù)還不足夠成熟,但這就和電腦早期發(fā)展一樣,技術(shù)本身是需要時(shí)間去發(fā)展的。當(dāng)年P(guān)C也同樣是從最開始的性能不足到后面慢慢被消費(fèi)者接受。
C端產(chǎn)品火過一陣后,越來越多的玩家開始深入B端,與行業(yè)相結(jié)合。黃勉超說,C端產(chǎn)品可以戲謔、搞笑的方式與用戶溝通,當(dāng)用戶說我要在附近找吃時(shí),智能音箱回答不了就會(huì)說,“哎呀,你是個(gè)吃貨”,但客服語音對(duì)答就不能有絲毫調(diào)侃,用戶查詢明天下午3:30是否有飛往大阪的航班,有就是有,沒有就是沒有,不可能存在第三個(gè)答案。
不過,整體移動(dòng)互聯(lián)網(wǎng)用戶增長(zhǎng)見頂,以及BAT等行家也紛紛入局,語音技術(shù)日趨成熟,客戶變對(duì)手,讓科大訊飛的技術(shù)優(yōu)勢(shì)漸消。但杜蘭認(rèn)為,BAT的到來會(huì)讓語音技術(shù)變得更好,這片海域是非常寬闊的,并不存在相互競(jìng)爭(zhēng)的問題。
而科大訊飛也在加快構(gòu)建一個(gè)融合共享的人工智能產(chǎn)業(yè)生態(tài)。有這樣一個(gè)經(jīng)典的故事:一位四川人石城川,11歲那年高燒因失去聽覺,2015年,他發(fā)現(xiàn)科大訊飛有一種語音識(shí)別技術(shù),盡管自己聽不到自己的發(fā)音,但是可以通過這種技術(shù)矯正自己發(fā)音,并識(shí)別正常人的語音轉(zhuǎn)換成文字,這樣就可以實(shí)現(xiàn)自己和正常人的對(duì)話。在咿咿呀呀的發(fā)音中,他重拾語言能力。后來,他創(chuàng)立了“音書”App,為聽障者和健聽者之間建立溝通的橋梁。
目前,科大訊飛開放平臺(tái)已為超過90萬開發(fā)者提供服務(wù),2018年,共有55.8%的創(chuàng)業(yè)團(tuán)隊(duì)借助科大訊飛技術(shù)實(shí)現(xiàn)創(chuàng)業(yè)夢(mèng)想。
隨著技術(shù)迭代更新越來越快,語音識(shí)別準(zhǔn)確率方面的提升越來越難,在眾多玩家之間,競(jìng)爭(zhēng)差距是更大還是更小?“企業(yè)間并不存在太大的技術(shù)差距,早期都是同一個(gè)技術(shù)公司,隨著技術(shù)紅利和技術(shù)壁壘的下降,后期推動(dòng)開源,不只是看單一的技術(shù)能力。”邱楠說,論技術(shù),有哪一家企業(yè)能競(jìng)爭(zhēng)過中科院?但企業(yè)是給技術(shù)找到技術(shù)場(chǎng)景,在此基礎(chǔ)上不斷延展,競(jìng)爭(zhēng)的維度一定是多元的,語音技術(shù)的壁壘也不會(huì)一直持續(xù)下去。
“我把企業(yè)分成兩大類,分別是技術(shù)輸出型和產(chǎn)品創(chuàng)新型,前者如谷歌,輸出安卓系統(tǒng);后者如蘋果,其技術(shù)能力是為自己定義差異化、尋找差異化服務(wù)。”邱楠說,我給我們的定位就是追求產(chǎn)品的差異化和創(chuàng)新性。
專家點(diǎn)評(píng)
智能語音市場(chǎng)整體處于啟動(dòng)期
廣州市社會(huì)科學(xué)院產(chǎn)業(yè)所副研究員 陳峰
智能語音是最早落地的人工智能技術(shù)。隨著行業(yè)數(shù)據(jù)資源的積累,深度學(xué)習(xí)算法的進(jìn)步,以及與其他人工智能技術(shù)之間的整合,語音識(shí)別、語義理解、語音合成技術(shù)將取得進(jìn)一步突破,語音交互有望成為新一代人機(jī)交互的主要方式。
目前,國(guó)內(nèi)外幾乎所有的科技巨頭都相繼進(jìn)入了智能語音市場(chǎng),國(guó)外有IBM的Watson、Google Now、蘋果的Siri、微軟的Cortana、Facebook的Message Platform、亞馬遜的Aleax等,國(guó)內(nèi)有阿里的天貓精靈、百度的度秘、騰訊的微信語音,以及科大訊飛、華為、小米、云知聲、依圖等發(fā)展的智能語音技術(shù)和產(chǎn)品。據(jù)《2017-2018中國(guó)智能語音產(chǎn)業(yè)白皮書》的數(shù)據(jù)顯示,2014年至2018年,中國(guó)智能語音產(chǎn)業(yè)規(guī)模由30億元增長(zhǎng)至159.7億元,五年間增長(zhǎng)了五倍。雖然有這么多的科技巨頭和新創(chuàng)AI企業(yè)進(jìn)入智能語音領(lǐng)域,產(chǎn)業(yè)規(guī)模也快速增長(zhǎng),但智能語音市場(chǎng)整體依然處于啟動(dòng)期,智能語音產(chǎn)品和技術(shù)變現(xiàn)尚處于起步階段,真正成熟的語音產(chǎn)品還需要時(shí)間的打磨。
國(guó)家高度重視新一代人工智能產(chǎn)業(yè)的發(fā)展,隨著新一代人工智能發(fā)展規(guī)劃的啟動(dòng)實(shí)施,加快產(chǎn)業(yè)化和應(yīng)用是著力點(diǎn)。工信部將進(jìn)一步推動(dòng)以智能語音為代表的人工智能核心技術(shù)發(fā)展,加強(qiáng)技術(shù)攻關(guān)、促進(jìn)行業(yè)融合應(yīng)用、優(yōu)化發(fā)展環(huán)境,務(wù)實(shí)推動(dòng)智能語音產(chǎn)業(yè)規(guī)模發(fā)展。可以預(yù)見,隨著行業(yè)應(yīng)用和場(chǎng)景的大規(guī)模切入,智能語音產(chǎn)品將快速迭代,產(chǎn)品的性能和用戶體驗(yàn)也會(huì)不斷提升,智能語音的發(fā)展大有可期。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。