人們都樂觀地相信人工智能可能給世界帶來的變革,但在這波技術(shù)浪潮中,能夠扮演“馬達”作用的企業(yè)還屈指可數(shù)。
英特爾中國區(qū)總裁楊旭向鈦媒體介紹,“人工智能事業(yè)部主要做三個方向:計算能力儲備;建立深度產(chǎn)業(yè)合作;具體領(lǐng)域?qū)崿F(xiàn)突破。
今年3月24日,英特爾總部宣布將組建了一個人工智能部門,名為AIPG(Artificial Intelligence Products Group),由英特爾此前收購的人工智能公司Nervana CEO Naveen Rao統(tǒng)領(lǐng)。這個事業(yè)部會涉及英特爾的許多產(chǎn)品部門,最關(guān)鍵的是統(tǒng)籌資源專注去做人工智能這件事。”
這是繼去年11月成立自動駕駛事業(yè)部之后,英特爾再次為某個領(lǐng)域設(shè)立獨立的事業(yè)部,其戰(zhàn)略意義可見一斑。
通常來講,人工智能分三層,最底層是芯片、計算、云等服務(wù)層
,屬于整個產(chǎn)業(yè)的基礎(chǔ)設(shè)施;,比如深度學(xué)習(xí)、計算機視覺,提供某個領(lǐng)域的通用算法;,也就是我們看到的無人駕駛、機器人等各種具備人工智能形態(tài)的產(chǎn)品。
人工智能不同于以往任何一場技術(shù)革命,它對芯片、算法、計算能力——這些像水和電一般的基礎(chǔ)設(shè)施都提出了截然不同的要求。
AI應(yīng)用百花齊放的時代還沒有到來,但說到底,它的繁榮并非一日之功,也絕不僅僅是AlphaGo下圍棋贏過人類那么簡單,
數(shù)據(jù)洪流推動芯片革命
近20年來芯片工藝制程的進化,按照摩爾定律,每隔18-24個月每硅芯片性能便會提升一倍的規(guī)律,從90年代的臺式計算機到現(xiàn)在的人手一部智能移動設(shè)備,單位面積計算力已經(jīng)有了15000倍的增長。
如果你對計算力的概念模糊,可以從數(shù)據(jù)的角度來感受一下。
在上世紀電腦誕生初期,一臺PC的內(nèi)存還以KB為單位,而現(xiàn)在智能手機隨便拍一張照片就是幾MB,拍一段高清視頻能達到幾個GB,數(shù)據(jù)的洪流正在以史無前例的速度向我們襲來,人工智能產(chǎn)業(yè)爆發(fā)的基礎(chǔ)已然具備。
英特爾研究院院長宋繼強預(yù)測稱,“預(yù)計到2020年,一個互聯(lián)網(wǎng)用戶每天將產(chǎn)生1.5GB的數(shù)據(jù),每臺自動駕駛汽車每天將生成超過4,000GB的數(shù)據(jù),人工智能方面需要的計算力將增長12倍,而這12倍的計算力會給我們帶來完全不一樣的世界。”
但是需要注意的是,摩爾定律并非一條普適的自然科學(xué)性質(zhì)定律,而是英特爾早期創(chuàng)始人戈登摩爾根據(jù)經(jīng)驗的一種觀察預(yù)言,因為大體符合實際趨勢,所以幾十年來一直被用于預(yù)測半導(dǎo)體行業(yè)的未來。
進入到人工智能時代,越來越多人開始擔心摩爾定律的極限,以及這種指數(shù)級的增長是否能夠永遠持續(xù),甚至這個命題伴隨著芯片產(chǎn)業(yè)的發(fā)展已經(jīng)存在了很長時間,也許誰都無法給出明確的答案,但可以肯定是,技術(shù)的難題(包括半導(dǎo)體工藝的演進、物理學(xué)量子效應(yīng)和光刻精度尚未突破)確實正在阻礙摩爾定律的速度。
底層基礎(chǔ)技術(shù)究竟是什么?
“對機器來說識別并不等于理解,人工智能研究在很多領(lǐng)域正停滯不前”
在剛剛落幕的Emtech Digital人工智能峰上,一位名叫GaryMarcus的人工智能領(lǐng)域著名研究者、認知科學(xué)家給當下火熱的人工智能行業(yè)破了一盆冷水,他認為,此言并非毫無根據(jù)。
然而現(xiàn)階段的人工智能發(fā)展遇到的一個主要瓶頸,就是人類現(xiàn)有的芯片計算技術(shù)
實現(xiàn)人工智能本質(zhì)是模仿人類進行感知、決策的行為,電腦需要處理巨大量的數(shù)據(jù),(以CPU為主)和人工智能希望模仿的人腦計算方式(深度神經(jīng)網(wǎng)絡(luò))存在著巨大差異。
CPU的工作過程類似工廠流水線作業(yè),即按部就班去做一件事,每個流程都存在著很強的關(guān)聯(lián)性,只有完成這個步驟才能進行下一步,我們通常聽到的雙核、四核、八核CPU都遵循這個邏輯,即便是英特爾推出256核CPU,也只是同時在處理256件事情而已。
人腦的計算方式比CPU高明很多,大腦有幾百億個神經(jīng)元,這幾百億個神經(jīng)元全部都是并發(fā)活動,如果把每個神經(jīng)元比作一個計算單位,人腦相當于幾百億個計算單元在同步進行著不一樣的事情,也就是利用我們后來經(jīng)常聽到的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),這種方式與目前依靠CPU流水線作業(yè)的計算方式大相徑庭,孰優(yōu)孰劣一目了然。
CPU+GPU、CPU+FPGA、CPU+ASIC
上面所說的這種異構(gòu)計算目前又被分為了幾個主流的結(jié)構(gòu):。
收購Nervana,占領(lǐng)深度學(xué)習(xí)高地
2016年8月,英特爾花費4億美元收購了Nervana這家初創(chuàng)公司,Nervana由3名神經(jīng)科學(xué)家于兩年前創(chuàng)立,創(chuàng)始團隊此前曾供職于高通神經(jīng)網(wǎng)絡(luò)部門,在高通任職期間,他們一直在研究的課題就是——如何才能讓計算機的性能和效率模擬人腦。
Nervana的創(chuàng)立的初衷也由此而來,公司最早的業(yè)務(wù)是依靠出售深度學(xué)習(xí)為基礎(chǔ)的硬件產(chǎn)品,后來通過云計算服務(wù)提供深度學(xué)習(xí)軟件,它被人工智能研發(fā)人員廣泛用于開發(fā)及部署神經(jīng)網(wǎng)絡(luò),由于Nervana從事的業(yè)務(wù)方向相對專注,再加上創(chuàng)始團隊均為研發(fā)出身,創(chuàng)立不久的Nervana在業(yè)界有著舉足輕重的地位。
和前幾天斥資153億美金收購自動駕駛領(lǐng)域公司Mobileye相比,4億美金對于英特爾這個級別體量的公司來說似乎有些不值一提,即便是花錢買個保險,性價比也是極高的,況且Nervana通過兩年多的發(fā)展已經(jīng)建立了自己的在深度學(xué)習(xí)領(lǐng)域的技術(shù)壁壘。
這家公司一直在努力將深度學(xué)習(xí)算法嵌入到計算芯片之中,而不是簡單地打造能夠在大量圖形處理器上運行的軟件,這個邏輯和英特爾發(fā)力人工智能芯片的思路不謀而合。
對像英特爾這樣的芯片制造商而言,Nervana最誘人的地方在于——
Nervana CEO Naveen Rao在接受媒體采訪時表示,“英特爾CPU是通用處理器,可以處理許多不同的工作,但它并沒有專門針對人工智能進行優(yōu)化。我們會在英特爾其他所有產(chǎn)品線中增加功能,使它們針對人工智能進行更多優(yōu)化。”
收購Nervana可以加大英特爾在人工智能領(lǐng)域芯片和算法的建設(shè)能力,這是其產(chǎn)品本身之于英特爾的吸引力,另外一個層面,很大程度上是為了抵御來自英偉達(Nvdia)的威脅,如果Nervana被Nvdia收入囊中,如今完全會是另外一番局面。
Nvdia的主戰(zhàn)場在GPU領(lǐng)域,GPU最關(guān)鍵的性能是并行計算能力,由于受到人工智能概念的影響,2016整個財年Nvdia美股的全年漲幅達到了驚人的224%,是當之無愧的明星公司。
今年,英特爾推出了經(jīng)過Nervana優(yōu)化的至強處理器+Lake Crest組合方案,據(jù)稱這款芯片在同樣的能耗水平上,相對于目前的頂級GPU在運行神經(jīng)網(wǎng)絡(luò)任務(wù)時會有更強的性能,它幫助英特爾在異構(gòu)計算領(lǐng)域中實現(xiàn)了卡位,畢竟“CPU+GPU”是目前最主流的計算結(jié)構(gòu),當初的AlphaGo就用了1920個CPU加上280個GPU的組合。
Altera、Movidius組合雙保險
GPU用于深度學(xué)習(xí)的效率要高于CPU,但是其設(shè)計之初是為了圖形計算并非人工智能計算,因此很多人開始思考能不能為人工智能設(shè)計一個專門的計算單元,于是有了FPGA、ASIC紛紛各領(lǐng)風(fēng)騷的態(tài)勢,以下分別來說。
FPGA
全稱為可編輯門陣列(Field Programmable Gate Array),其基本原理是在FPGA芯片內(nèi)集成大量的數(shù)字電路基本門電路以及存儲器,開發(fā)者通過燒入FPGA配置文件重新定義這些門電路以及存儲器之間的連線,簡單講是一種可重構(gòu)的芯片體系結(jié)構(gòu),再通俗一點就是可以像手機那樣“刷機”。
根據(jù)需要,開發(fā)者可以把同一個FPGA配置成不同場景下使用的計算芯片,微控制器MCU、音頻編解碼器、適用于深度學(xué)習(xí)的處理器架構(gòu)等等,F(xiàn)PGA屬于半定制的芯片版本,比大規(guī)模的單個定制部件的成本低得多且具備更高的靈活性,一塊FPGA開發(fā)板售價通常只有1000美金。
在可編輯邏輯領(lǐng)域的市場份額評估中,英特爾預(yù)估Xilinx占有49%,Altera占有中的39%,其他供應(yīng)商分則瓜余下的12%。
目前FPGA領(lǐng)域的大玩家主要有兩個,Xilinx和Altera,其中Altera已經(jīng)被英特爾以167億美元的天價收至麾下。
計算結(jié)構(gòu)ASIC
另外一種(Application Specific Integrated Circuit),是專為人工智能設(shè)計的集成電路芯片,可以理解為FPGA的定制版本,如果專門為了深度學(xué)習(xí)去做芯片顯然擁有更強的針對性,一旦規(guī)?;慨a(chǎn)成本將會大范圍降低。
不同于FPGA的靈活性,ASIC結(jié)構(gòu)的芯片一旦設(shè)計出來就很難更改,其設(shè)計研發(fā)周期要遠大于FPGA,上市速度緩慢,用最新的工藝制造ASIC芯片單次研發(fā)成本動輒幾百上千萬美元,風(fēng)險也高于FPGA的解決方案,基本上相當于一錘子買賣,沒賭對就賠了。
即使九死一生也要奮力一搏,更何況是在賭一個大方向很明確的未來。
為此,英特爾于2016年9月份收購了愛爾蘭芯片公司Movidius,這家公司目前成立將近10年,主要產(chǎn)品是自主研制的低功耗視覺處理器:VPU(Vision Processing Unit),為谷歌Tango平板電腦和大疆無人機等產(chǎn)品都提供過視覺解決方案。
被英特爾收入囊中的Movidius被完全收購已經(jīng)與英特爾的原有的RealSense實感技術(shù)進行整合,探索計算機視覺方面的芯片方案。
FPGA和ASIC這兩種方式在實現(xiàn)深度學(xué)習(xí)加速器方面各有所長,在一定程度上存在替代關(guān)系,F(xiàn)PGA的可配置性更適合企業(yè)、軍工等應(yīng)用,而ASIC的高性能和低成本則適合消費電子領(lǐng)域。
“對于復(fù)雜的場景其實是希望使用一個通用的CPU,看你的負載要求可以使用酷睿系列的CPU,或者至強系列CPU去搭配硬件加速模塊,硬件加速模塊可以選擇FPGA還是Nervana,這是看具體的應(yīng)用具體分析”,英特爾研究院院長宋繼強表示。
準備所有可能,應(yīng)對芯片大戰(zhàn)
對于英特爾來說,尋找處理下一代計算任務(wù)的芯片架構(gòu)迫在眉睫,英特爾在這場芯片大戰(zhàn)中,幾乎準備了所有可能存在的處理器架構(gòu)來應(yīng)對挑戰(zhàn),群雄逐鹿的精彩對決已經(jīng)拉開了帷幕。
與我們熟悉的互聯(lián)網(wǎng)行業(yè)不同,芯片產(chǎn)業(yè)的變化周期要長很多,90年代的個人PC是芯片廠商主戰(zhàn)場,隨著智能手機爆發(fā)開始轉(zhuǎn)向移動端也就是智能手機,盡管此役高通和ARM大敗英特爾,但在PC領(lǐng)域始終沒有任何人能撼動的英特爾的壟斷地位,長達25年的時間幾乎碾壓對手。
如今的人工智能時代無疑也將迎來一個芯片行業(yè)的拐點
,只是曾經(jīng)強者恒強的規(guī)律可能并不適用,在這個新舊時代交替的節(jié)點,各種架構(gòu)的計算處理器正處在混合過渡的階段,尚未形成一家獨大的局面。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。