云知聲CEO黃偉
2016年3月,圍棋人工智能程序AlphaGo擊敗李世石,再次引發(fā)人工智能關(guān)注熱潮。“坐了十幾年冷板凳”的云知聲CEO黃偉,順著物聯(lián)網(wǎng)興起的兆頭,也許迎來語音識(shí)別最好的發(fā)展時(shí)機(jī)。
2003年前后,這個(gè)行業(yè)曾經(jīng)經(jīng)歷過一次高潮,因?yàn)檎Z音識(shí)別實(shí)驗(yàn)室識(shí)別精確度達(dá)到90%以上水平,大小公司蜂擁而至。2005年全球領(lǐng)先的語音識(shí)別公司Nuance上市,市值最高突破90億美元。2008年,科大訊飛(002230)上市,國內(nèi)市場占有率一度占到70%以上。
但是,只有極少數(shù)公司在這一波浪潮里突出重圍。語音識(shí)別在實(shí)際使用場景精確度降到很低,短時(shí)間內(nèi)技術(shù)解決基本無望。大公司紛紛關(guān)閉語音識(shí)別相關(guān)部門,熱潮不過曇花一現(xiàn)。
平臺(tái)化實(shí)現(xiàn)彎道超車
移動(dòng)互聯(lián)網(wǎng)的興起、機(jī)器深度學(xué)習(xí)(AlphaGo的主要工作原理)的發(fā)展,讓語音識(shí)別再次呈現(xiàn)上升之勢(shì)。蘋果2億美元收購Siri Inc.公司,2011年發(fā)布Siri語音助手。同年,谷歌連續(xù)收購語音通信公司SayNow和語音合成公司Phonetic Arts,亞馬遜收購語音識(shí)別公司Yap。
2012年6月,梁家恩創(chuàng)立云知聲。這個(gè)時(shí)候,科大訊飛已經(jīng)在國內(nèi)語音識(shí)別市場筑起了深厚的壁壘。要想實(shí)現(xiàn)彎道超車,梁家恩想得很清楚:第一是算法;第二是數(shù)據(jù)。如果算法是引擎,那么數(shù)據(jù)就是燃料。哪怕算法得到極大提升,如果沒有油的話,車還是跑不起來。
左起:云知聲董事長兼CTO梁家恩、云知聲CEO黃偉
梁家恩決定做開發(fā)者平臺(tái)。對(duì)于一家創(chuàng)業(yè)公司而言,平臺(tái)包袱無疑很重,團(tuán)隊(duì)也有過糾結(jié)。“我們必須把平臺(tái)先做起來,讓市場看到云知聲的能力。”語音識(shí)別技術(shù)最關(guān)鍵的是先要有充足的語料積累,不光是找人去錄語音,更需要用戶真實(shí)的數(shù)據(jù)。而做平臺(tái)能夠在短時(shí)間內(nèi)完成大量的語音數(shù)據(jù)積累,以實(shí)現(xiàn)彎道超車。
淘寶上買機(jī)器、普通游戲顯卡,10個(gè)人不到的工程師團(tuán)隊(duì),自學(xué)深度學(xué)習(xí)算法,3個(gè)月平臺(tái)上線。
“沒有人想到這樣一家剛成立的小公司真的能做出來。”云知聲董事長兼CTO梁家恩現(xiàn)在說起來還頗為得意。2012年9月云知聲發(fā)布的語音平臺(tái),當(dāng)時(shí)精確度只能做到85%,如果真正應(yīng)用到實(shí)際場景,甚至?xí)档?0%。到2013年底,語音數(shù)據(jù)已從最開始的800小時(shí)積累到3000小時(shí),精確度提高到95%,平臺(tái)上的開發(fā)者大大小小已有8000多家。4年以來,云知聲開發(fā)者平臺(tái)每年保持400%的增長量,目前每天調(diào)用量在1.5億到2億次之間。
平臺(tái)也打出了云知聲的名氣,語音識(shí)別技術(shù)在人工智能領(lǐng)域相對(duì)成熟,這家公司開始考慮商業(yè)化。一開始,他們就選擇了從B端切入。云知聲CEO黃偉始終認(rèn)為,在人工智能領(lǐng)域,B2C在中國很難實(shí)現(xiàn),這也是黃偉一直堅(jiān)持不做單品的原因。
和搜狗合作,云知聲一戰(zhàn)成名。
當(dāng)時(shí)搜狗和百度都在搶時(shí)間點(diǎn),想率先發(fā)布語音助手。但搜狗本身并沒有這部分技術(shù),將市場上各家的產(chǎn)品一一測試,綜合價(jià)格因素,一周時(shí)間便與云知聲達(dá)成合作。
小i機(jī)器人(300024)也是云知聲早期的客戶。對(duì)方給銀行提供服務(wù),之前都是文本,后來逐漸拓展到語音領(lǐng)域??拼笥嶏w是它當(dāng)時(shí)的服務(wù)提供商,收費(fèi)很高,小i機(jī)器人便找到云知聲。云知聲以相對(duì)低的價(jià)格拿下客戶。
黃偉說:“在市場、技術(shù)不成熟的前提下,過高的使用門檻無疑是殺雞取卵。”
和樂視的合作,除了技術(shù)上的相對(duì)優(yōu)勢(shì)以外,樂視當(dāng)時(shí)也處于起步階段,而科大訊飛更愿意圍繞運(yùn)營商來提供服務(wù)。當(dāng)樂視自身尚沒有證明自己能力時(shí),科大訊飛相對(duì)是保守的,這就給了云知聲機(jī)會(huì)。
云知聲早期合作公司多為互聯(lián)網(wǎng)公司,他們更敢于嘗試新的東西,快速迭代。傳統(tǒng)公司相對(duì)保守,除了產(chǎn)品本身好壞,出身等其他因素也會(huì)被納入考量。
“在云知聲規(guī)模還很小的時(shí)候,對(duì)于客戶而言,如果選擇大廠商,出了問題是大廠商的責(zé)任。但如果選了云知聲,出問題的話,決策者自己需負(fù)很大責(zé)任。”黃偉告訴“”。
2013年初,先后供職摩托羅拉中國研究中心、Nuance,一手創(chuàng)立盛大語音創(chuàng)新院的黃偉加入云知聲,擔(dān)任CEO。“從讀書的時(shí)候開始,之后10年工作,我終于等到一個(gè)可以放手去做這件事情的機(jī)會(huì)。”黃偉穿著深綠色襯衣,牛仔褲,戴著無框眼鏡,頭發(fā)抓得一絲不茍。談話之間偶爾取下手腕上的佛珠撥弄。
“商業(yè)上的技巧我們確實(shí)吃過很多虧,我們不是商務(wù)驅(qū)動(dòng)型的公司,最開始就是拿產(chǎn)品過去,實(shí)打?qū)嵉販y試,比識(shí)別率、比響應(yīng)速度等。”
差異化贏得時(shí)間
云知聲IoT事業(yè)部副總裁康恒說:“平臺(tái)給云知聲帶來的另一個(gè)收獲,我們得以發(fā)現(xiàn)市場所聚焦的需求。通過不同行業(yè)用戶在平臺(tái)上的使用頻度,能夠精準(zhǔn)捕獲市場需求。”車載、家居、醫(yī)療和教育,是云知聲的四大重點(diǎn)領(lǐng)域。
2014年,市場上已有汽車廠商將安卓系統(tǒng)和車載設(shè)備相結(jié)合,黃偉隱約看到車聯(lián)網(wǎng)的興起之勢(shì)。很快,云知聲成立專門的車載語音技術(shù)團(tuán)隊(duì)。
從整個(gè)車載語音設(shè)備行業(yè)來看,前裝市場規(guī)模大,但產(chǎn)品周期長,且科大訊飛深耕已久。后裝市場滿足用戶購車后的個(gè)性化需求,市場規(guī)模小,但少有入局者。
當(dāng)時(shí)的后裝市場魚龍混雜,大大小小的廠商遍地都是,質(zhì)量良莠不齊。黃偉也是摸著石頭過河,只能一再謹(jǐn)慎,盡可能選擇優(yōu)質(zhì)廠商合作,采取統(tǒng)一授權(quán)以減小風(fēng)險(xiǎn)。
截至2016年上半年,云知聲車載行業(yè)的產(chǎn)品激活量近兩百萬臺(tái),收入規(guī)模達(dá)千萬級(jí)別。
智能家居是云知聲的又一重鎮(zhèn)。
隨著物聯(lián)網(wǎng)概念的興起,幾乎所有的家居廠商都在探索智能家居的未來。語音識(shí)別在智能手機(jī)上的應(yīng)用并不是剛需,觸摸已經(jīng)能夠解決大部分的應(yīng)用場景。對(duì)于鮮少擁有觸控屏幕的家居產(chǎn)品,語音交互很快成為廠商間的共識(shí)。
早在2014年,云知聲和一些家電巨頭就有過接觸,但先期落地的產(chǎn)品主要集中在創(chuàng)業(yè)公司。這些創(chuàng)業(yè)公司希望生產(chǎn)一些智能化的產(chǎn)品,雖然量都不大,云知聲技術(shù)團(tuán)隊(duì)仍全力配合開發(fā),不斷試錯(cuò),打磨技術(shù)。
“2015年,我們?cè)诩揖有袠I(yè)的策略是和小公司玩;從2016年起,我們也要和巨頭共舞。”黃偉說。
美的一直看重智能家居,尤其空調(diào)這個(gè)單品,從2012年起便不斷尋找智能化解決方案,和科大訊飛、韓國Powervoice都有過合作。
2014年底,云知聲開始和美的接觸。對(duì)方要求明確:第一、用戶直接通過語音方式控制空調(diào),且不受噪聲影響;第二、一定距離的遠(yuǎn)場語音交互得以實(shí)現(xiàn);第三、方案成熟,成本控制。
遠(yuǎn)場語音交互是關(guān)鍵中的關(guān)鍵。
當(dāng)時(shí)市場上普遍解決方案都是八個(gè)麥克風(fēng)收音,雖然語音識(shí)別準(zhǔn)度得以提高;但能耗、安裝等問題卻接踵而來。
云知聲團(tuán)隊(duì)做了大量先期工作,發(fā)現(xiàn)像空調(diào)這類產(chǎn)品,它永遠(yuǎn)都是貼墻放,八個(gè)麥克風(fēng)在實(shí)際應(yīng)用上是多余的。云知聲提出雙麥克技術(shù),兩個(gè)麥克風(fēng)間距不過三厘米,在任何產(chǎn)品上均可自然適配,即插即用。
一下少了六個(gè)麥克風(fēng),如何保證遠(yuǎn)場語音交互能達(dá)到測試要求,云知聲花了一年半來解決這個(gè)問題,2015年底投入生產(chǎn)。
2016年8月1日,美的智能語音空調(diào)正式發(fā)布。
從2015年開始,云知聲涉足醫(yī)療領(lǐng)域。2013年前后,云知聲就想往醫(yī)療方向發(fā)展,初步接觸下來,當(dāng)時(shí)的時(shí)間點(diǎn)太早,需求尚沒有爆發(fā)。
語音識(shí)別在人工智能各領(lǐng)域中雖然相對(duì)成熟,但遠(yuǎn)沒有到頂。除了高度的提升,廣度則是所有語音識(shí)別廠商需要發(fā)力的領(lǐng)域:比如特定行業(yè)的語音識(shí)別、歌曲識(shí)別、方言識(shí)別等。像之前在線上語音識(shí)別精確度能達(dá)到96%,當(dāng)落實(shí)到和醫(yī)院合作時(shí),精確度急劇降到60%左右。
云知聲銷售楊拓剛開始做醫(yī)療客戶時(shí),也很不適應(yīng):醫(yī)學(xué)里有大量專業(yè)術(shù)語,在日常生活中是鮮少應(yīng)用。如何保證系統(tǒng)知識(shí)庫既能準(zhǔn)確識(shí)別日常對(duì)話交流,同時(shí)又能對(duì)這些專業(yè)術(shù)語進(jìn)行分辨,平衡很重要。
當(dāng)時(shí)客戶需求反應(yīng)過來,團(tuán)隊(duì)馬上根據(jù)不同科室,短時(shí)間內(nèi)人力收集專業(yè)信息,同時(shí)輔以機(jī)器學(xué)習(xí),通過大量醫(yī)療數(shù)據(jù)積累推動(dòng)算法提升。經(jīng)過跟醫(yī)院場景和醫(yī)學(xué)術(shù)語的深度定制,語音識(shí)別的精確度提升至95%,部分科室經(jīng)過優(yōu)化達(dá)到98%。
2015年底,云知聲的語音識(shí)別服務(wù)在北京協(xié)和醫(yī)院四個(gè)科室上線使用,2016年起全院推廣。“最開始我們確實(shí)會(huì)選擇一些相對(duì)競爭不那么充分的領(lǐng)域先行切入,但我們不會(huì)為了回避競爭,而選擇一些根本不存在的市場。”黃偉說。
Nuance在醫(yī)療市場,光美國一個(gè)國家的年收入就接近20億美元。
押寶芯片深耕物聯(lián)網(wǎng)
2015年,亞馬遜推出家用智能音響Echo,被視為目前語音識(shí)別領(lǐng)域最出色的實(shí)體產(chǎn)品,依托亞馬遜平臺(tái),2016年上半年,出貨量300萬臺(tái)。
微軟推出小冰,百度將語音團(tuán)隊(duì)獨(dú)立,阿里巴巴將語音識(shí)別技術(shù)全面應(yīng)用在阿里云系統(tǒng)上,騰訊智能語音服務(wù)系統(tǒng)也上線。
這一波人工智能熱潮里,巨頭們紛紛入場。
黃偉相信語音交互一定是人機(jī)交互最自然的形態(tài)。前端語音交互提供入口,后端互聯(lián)網(wǎng)提供服務(wù)。只有二者充分的結(jié)合,才能為用戶帶來更多價(jià)值。
而“云端芯”則是在這一輪語音交互競爭中黃偉的希望所在:云是線上平臺(tái),沉淀大量基礎(chǔ)數(shù)據(jù);端最開始是智能手機(jī),現(xiàn)在已全面向物聯(lián)網(wǎng)遷移;芯片則是云知聲所有技術(shù)和服務(wù)的載體。
早在2014年底,云知聲完成來自高通的5000萬美元B輪融資后,便開始發(fā)力芯片領(lǐng)域。對(duì)于物聯(lián)網(wǎng)而言,終端對(duì)功耗非常敏感,市場上現(xiàn)有芯片往往搭載很多不必要的功能,標(biāo)準(zhǔn)程度、穩(wěn)定性達(dá)不到要求。
芯片的設(shè)計(jì)、制作困難重重。云知聲之前和一家公司合作,當(dāng)時(shí)在產(chǎn)品部門測試全部通過,結(jié)果到了工廠,實(shí)際操作中不適配。工廠的生產(chǎn)是有排期的,如果一定時(shí)間內(nèi)不能測試通過投入生產(chǎn)的話,整個(gè)產(chǎn)品線都要延期。對(duì)方給了兩天時(shí)間,云知聲的工程師直接駐廠,一邊不斷調(diào)試一邊和對(duì)方溝通。
現(xiàn)在,云知聲與高通合作的特殊芯片,功能集中,能耗劇降,適配程度大幅提高。
2007年,第一代iPhone推出,接下來近十年里,移動(dòng)互聯(lián)網(wǎng)風(fēng)生水起。隨著智能手機(jī)普及率提升,2016年智能手機(jī)全球出貨量增長幾乎停滯,根據(jù)市場研究公司Strategy Analytics數(shù)據(jù),全球智能手機(jī)出貨量2016年二季度為3.404億部,相比于2015年同期的3.38億部,僅增加了1%。
那移動(dòng)互聯(lián)網(wǎng)之后呢?
“物聯(lián)網(wǎng)將是一個(gè)比移動(dòng)互聯(lián)網(wǎng)更偉大的時(shí)代。”黃偉告訴“”。
目前云知聲幾乎將全部資源押寶物聯(lián)網(wǎng)布局,智能家居、車聯(lián)網(wǎng)、智慧醫(yī)療和教育四大領(lǐng)域,合作客戶近兩萬家。他認(rèn)為云知聲的未來將是物聯(lián)網(wǎng)領(lǐng)域內(nèi)一家優(yōu)秀的人工智能服務(wù)公司,讓機(jī)器更好地理解用戶,交互變得自然而智能。
“我希望它會(huì)成為萬物互聯(lián)之下的BAT。”
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。