對于很多剛畢業(yè)的人來說,工作的前幾個月還在不斷學習,還在默默無聞地做一些底層的事情。而他,一個剛畢業(yè)不久的百度工程師,就在語音智能技術的發(fā)展史上,刻印下了自己深深的足跡。這個足跡到底有多深?他,又是如何成就了這一刻?
為了找尋到答案,筆者與他對話了整整兩個小時,記錄下了成功的內因與外素,或許能為一些快要畢業(yè)或剛畢業(yè)不久的人帶來啟示。不過,出于人才保護的需求,筆者答應不公開名字,而以“他”來進行描述。
下面,就一起跟著我們的主人公走進那艱苦研究的日子——
十年難題,一朝攻克
“哇!這次成功了!”看到實驗數(shù)據(jù)的他,興奮地呼喚來身邊的同事,每個人臉上的喜悅都難以掩飾,安靜的辦公室里一下子歡騰起來——這一刻,他記憶猶新:十年難題,一朝攻克,這種突破重重障礙,獲得成功后的喜悅已不是一般的詞語能夠表達的了。
“這次你們取得的技術,有多重大的意義?”作為非技術研發(fā)人員,我還是有些疑惑。
他沒有說話,而是在電腦上敲了一陣,然后把屏幕轉向我。“看,很多媒體都在關注和報道這件事。”
《對人工智能多點耐心百度漢語語音識別獲重大突破》、《百度打破漢語語音識別領域技術壁壘》、《百度語音技術獲重大突破開發(fā)者將享受先進成果》……我一篇篇點開鏈接,大致看了一下報道內容,其核心主要是“百度此次的技術創(chuàng)新,使得語音識別相對錯誤率比現(xiàn)有技術降低15%以上,使?jié)h語安靜環(huán)境普通話語音識別的識別率接近97%。這是繼2011年,引入深度學習技術,相對錯誤率降低20%~30%之后,語音技術領域又一次具有標志性意義的重要進展。”
我自嘲有些“不明覺厲”,他很耐心地解釋到:“我們現(xiàn)在經常會對著某個手機應用說話,然后手機會將其翻譯成文字,這主要應用了語音識別技術,是人工智能領域的一個分支。這個技術的優(yōu)劣表現(xiàn)在我們的實際應用中,就是識別地更準確、更快,而且,對產業(yè)來說,提供語音識別服務的成本更低。”
經他這么一說,我倒回想起來:以前,對著一些手機應用說話,翻譯出的文字,并不是很準確,而且時間上有一定延遲,而現(xiàn)在似乎準確了很多、也快了很多。
“是的,這就是技術進步所帶來的效果。”他說,“而我們這次攻克了十多年來世界范圍內的一個難題——成功地將LSTM(長短時記憶模型)和CTC(連接時序分類)建模技術結合應用在語音領域,讓語音識別準確率得到了一次很大的提升。識別得更準確、速度更快了,同時,產業(yè)的應用成本也將更低。我們部門的負責人賈磊,也因為這項技術突破,受邀參加全國人機語音通訊學術會議,發(fā)表演講。那可是中國人機語音交互領域最權威的學術會議!”他的言語中透著自豪感。
十年難題,一朝攻克!“你覺得是什么原因,讓你們能夠成功打破十多年來別人都沒有克服的難題?”我又問。
“選對平臺,刻苦堅持。”他沉思了一會兒,告訴我。短短8個字,卻蘊含著很大的深意——
選對平臺,站在巨人肩膀上舞蹈
在媒體報道中,有這樣兩段描述:
“LSTM和CTC建模技術結合,其核心難度之一就在于海量數(shù)據(jù)下的深度學習需要強大的計算能力,這兩項技術的計算量比傳統(tǒng)深度學習的計算量大一個數(shù)量級。直接按照數(shù)學公式去實現(xiàn)上述算法,LSTM和CTC訓練就需要采用單幀遞推模式,這樣的訓練速度在工業(yè)條件下的將近1萬小時訓練數(shù)據(jù)下,幾乎是不可能實現(xiàn)的。”
“對比谷歌2015年9月份于Interspeech 發(fā)表的在英文領域的類似研究成果,百度的訓練數(shù)據(jù)是谷歌的4-5倍,模型訓練參數(shù)規(guī)模是谷歌的10-20倍。而該技術成功突破的核心要素之一就是訓練能力的極致提升,大模型大數(shù)據(jù)下的難度要比實驗室小數(shù)據(jù)小模型的情況下難很多。百度研發(fā)出的全新訓練算法,更接近工業(yè)大數(shù)據(jù)的產品實踐,是可以推廣到10萬小時訓練的全新技術。”
“從這些報道看來,海量數(shù)據(jù)以及大數(shù)據(jù)計算能力,是成功的關鍵要素之一?”我向他求證道。
他點了點頭。“目前的科學已經到了數(shù)據(jù)科學階段,需要靠海量數(shù)據(jù)和極致計算能力,來推動科學的進一步發(fā)展。”
語音識別技術也是如此,他說,之前提到的十年技術困局,困住大家的是什么?主要就是計算能力。“通過百度擁有的海量數(shù)據(jù)、大數(shù)據(jù)平臺,以及一些算法創(chuàng)新,我們很好地解決了這個極致計算難題。”
他坦言,如果沒有百度這樣的大數(shù)據(jù)能力,這次突破很難實現(xiàn)。
當然,大數(shù)據(jù)能力是一方面,但更讓他意外和感激的是,百度這個平臺給予他的機會和空間。
“這是一個很重大的研究項目。當同事告訴我,讓我加入項目組共同研究的時候。”他頓了頓,露出了又驚訝又興奮的模樣,然后指著自己說,“我當時就是這樣的表情。”
他真的很意外,因為組里的人基本上都是這個領域很牛、很資深的人。“沒想到會讓我一個新人參與其中”。彼時,他才剛剛進入百度。
作為一個新人,少不了些許拘謹和對老員工的敬畏。“一開始,還想著自己是不是應該完全跟著高T們(技術級別很高的人),幫著他們打打下手就好”。但后來,他發(fā)現(xiàn)自己錯了。“他們給了我很大的發(fā)揮空間,讓我平等思考、研究,參與到整個過程中。再后來,我才了解到,不僅在我們項目組,原來這里的氛圍都是如此。”
就這樣,剛畢業(yè)入職的他,擔起了這項重擔。在機會面前,他成功地抓住了它:這靠得是他的努力與堅持——
成功非易事,常絕望到想放棄
相信很多成功的人都有一個感受,在成功之前,失敗是家常便飯。對他來說,亦是如此。
“有時候做出一個推測,感覺很靠譜,但幾組試驗下來,卻沒得到想要的結果。”他說,“于是,大家就開始討論失敗的原因,經常會從下午討論到深夜。”在又累又困中,梳理了幾種可能性和解決方案,可是第二天來一試,經常還是不成功。
失敗,換方法,再試驗……在這個幾個月中,他的內心如同起伏的波浪:失落、懷疑,絕望,自我鼓勵,再一次堅持。他回憶道:“絕望到快要放棄就有3、4次。”
這是怎樣的感覺,也許作為外人難以體會。在一次次失敗與自我懷疑中,要堅持下來,更是一個很難感受到的艱辛的心理歷程。
然而,就在這一次次的堅持下,成功慢慢地走近了他們。
“有一天晚上,和平常一樣,我們研究著某個方法為何失敗,該如何解決。”那天,從晚上7、8點研究到12點多,最后,竟然發(fā)現(xiàn)了一種解決方案,一舉解決了技術上的一大難題。這一天讓他印象深刻,不僅僅因為技術上獲得突破,也因為那一天他和女友有個重要約會,而自己爽約了。
回顧這次成功,他很感慨,自己沒有放棄而是堅持了下來。
他說,如果沒有給他這個機會,他不會取得這次成功;如果沒有技術大牛在研究過程中分享經驗,提供思路,他不會取得這次成功;如果沒有百度的大數(shù)據(jù)能力,他不會取得這次成功;如果沒有堅持到最后,他不會取得這次成功。
的確,成功并不容易,需要內因和外因多個因素共同作用。有眼光、有能力,選對平臺和道路,并且能努力奮斗、持續(xù)堅持的人,相信成功離他并不遙遠。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網頁分享至朋友圈。