11月23日,“百度語音開放平臺3周年慶”活動在京舉行。百度宣布將在其語音開放平臺上線三周年之際,開放四項全新語音技術的接口,用戶在使用語音與機器進行交流時,能夠享受到更奇妙的交互體驗。
百度公司首席科學家吳恩達在演講中介紹,這四項語音技術,包括情感合成、遠場方案、喚醒二期技術和長語音方案。吳恩達現場宣布即日起百度將會把這幾項技術免費開放給用戶和開發(fā)者共享。
“最新的語音技術有很大的潛力,能夠徹底改變人機交互的效率和辦法。未來語音技術在很多應用場景有很好的機會,將為人機交互帶來巨大的改變。”吳恩達表示,最新的語音技術旨在解決用戶在使用語音交互時遇到的一些關鍵問題。例如,百度情感合成技術主要聚焦在為合成語音“加入情感”,目前可達到接近真人發(fā)聲效果。
“極智開放·共語未來——百度語音開放平臺3周年慶”現場
活動現場,來自斯坦福大學的人工智能專家James Landay,也分享了一項與百度合作的最新研究成果,該研究發(fā)現智能手機在運用語音方式進行輸入時,輸入速度比鍵盤輸入快了3倍。他表示,近兩年,受益于大數據和深度學習技術的不斷發(fā)展,語音識別技術突飛猛進,速度及準確性都有了長足進步。
目前,百度語音開放平臺的合作伙伴已涵蓋多個領域和場景,包括智能手機領域的聯想、中興;智能家居領域的長虹智能電視、康佳智能電視、SONY智能電視;汽車行業(yè)的特斯拉、途勝;智能設備領域的惠普、艾米通訊;智能服務領域的攜程、手機QQ閱讀等。
“語音是人類交流最自然的方式,通過開放語音技術,百度希望可以引領語音功能產品的繁榮發(fā)展。”吳恩達表示。
作為國內最為開放的領先語音技術開放平臺,百度語音開放平臺自2013年10月上線以來,每日在線語音識別要求從2013年的500萬上升到今天的1億4千萬,在線語音合成每日請求達2億,開發(fā)者數量超過14萬。
據百度提供的數據,在技術指標方面,百度語音識別準確率目前已達97%,居于全球領先。今年2月,百度深度語音識別系統(tǒng)Deep Speech 2入選MIT 2016十大突破技術。包括語音技術在內的百度大腦,入選2016第三屆烏鎮(zhèn)世界互聯網大會15大領先科技成果,成為國內唯一入選的綜合型人工智能技術。
分享到微信 ×
打開微信,點擊底部的“發(fā)現”,
使用“掃一掃”即可將網頁分享至朋友圈。