近來跑出去參加了兩次會議:虎嗅的FM以及新浪科技的C+峰會,很有意思的是兩次會上都有關(guān)于人工智能的話題,前者是余凱等的一個論壇后者則是微軟研究院洪小文做了關(guān)于小冰的演講。C+峰會的走廊上還有一個接入了圖靈系統(tǒng)的NAO機器人,可惜的是我去捅它的時候,它正充電,完全不搭理我。但各種文章、書籍、對話和演講聽下來,看下來我發(fā)現(xiàn)還很少有人對人工智能整體做過歸納,這篇文章正是這樣一種嘗試。嘗試把各種五花八門的產(chǎn)品和技術(shù)梳理出一點脈絡(luò)。
重新啟動的自動化
在1946年,美國福特公司的機械工程師D.S。哈德就提出了“自動化”一詞,此后各種提高自動化程度的技術(shù)層出不窮,但就和傳統(tǒng)軟件一樣,過去的自動化更多的是處理能清楚定義邊界的工作的自動化,對于邊界不清晰,環(huán)境特別復(fù)雜的情形則有點力不從心。拿掃地機器人來做例子最容易說清這兩類情形:如果就限定是很大的、固定是長方形的、沒什么障礙物的屋子的清掃,那就很容易設(shè)計一種掃地機器人來完成確定的清掃方案,但這在居家的掃地機器人身上就行不通,因為不同人的屋子總是會有差別,這意味著這種居家掃地機器人必須處理預(yù)先沒被定義的各種情形。這是條紅線,沒有人工智能的發(fā)展,自動化的程度就會限定在這條紅線下面。這反過來也就意味著,如果人工智能可以賦給機器更多的智力,那原本那些自動化方案沒法搞定的領(lǐng)域,現(xiàn)在也可以開始自動化了。這種領(lǐng)域很多,散布在種種不同的行業(yè)中,如果按照潛在的影響力來做大致的排行的話,那么是:
一、自動駕駛
自動駕駛所能帶來的變化肯定會大于電動這種單純的能源變換所帶來的變化,因為一旦自動駕駛真的實現(xiàn),車在人們心目中的意義很可能會發(fā)生巨大變化并使車上的共享經(jīng)濟真的得以實現(xiàn)。想象下在龐大且復(fù)雜的調(diào)度算法的支持下,每個人的出行需要都可以按需滿足,那人們?yōu)槭裁葱枰惠v自己的車。
自動駕駛的發(fā)展有兩種路線:一種是Google式的,特點是一下子實現(xiàn)終極目標(biāo),中間沒有過渡;一種則是以各大車廠為代表的漸進式自動駕駛實現(xiàn)路線。
要想判斷那種更容易先成功那么需要考慮到由現(xiàn)有狀態(tài)到自動駕駛的更迭不只是車的更迭,而是整個系統(tǒng)的更迭。所謂整個系統(tǒng)的更迭至少有兩方面的含義:
一個是自動駕駛所需要的支撐系統(tǒng)必須是完整實現(xiàn)的。一般來講加油/充電、事故維修、保養(yǎng)是汽車運轉(zhuǎn)必須的幾項支撐。但這點對自動駕駛路線影響并不大,兩條路線應(yīng)該都是可以嵌入到現(xiàn)有系統(tǒng)里來。
另一點則是車所需要面對的環(huán)境是一體的,逐個場景來實現(xiàn)自動駕駛理論上似乎是個誤區(qū),因為現(xiàn)實里很難清晰劃定場景的邊界。我們可以講突然躥出人這種場景在高速路上就絕對不會出現(xiàn),不需要處理,在一般街道上就需要處理嗎?而要想徹底解決自動駕駛里的問題,其根本并不在車本身,而在于數(shù)據(jù)(道路的數(shù)據(jù)、雷達等感知到的數(shù)據(jù)等)以及數(shù)據(jù)的處理。所以從這個角度看,車本身是已經(jīng)被征服的技術(shù)點,Google這樣的公司去搞車雖然難,但有舊例可循,但與此相比車廠去處理數(shù)據(jù)則更難。
這兩種路徑看著是后一種更穩(wěn)妥,但實際上很可能是Google那種路線最終會勝出。因為從場景的角度看要么你完全搞定了自動駕駛,要么沒搞定,似乎沒有給中間狀態(tài)留太多的空間。
現(xiàn)在的估計是自動駕駛會在5~10年內(nèi)變成一種大眾化的技術(shù),其中5年估的就是那種漸進式的路線,如果按照上述邏輯進行修正,那么這事離我們大概還有10年遠(yuǎn)。
二、服務(wù)機器人
服務(wù)機器人里面最典型的就是掃地機器人,其它如酒店服務(wù)機器人、安保機器人等也都可以劃入這個類別。也許還會涌現(xiàn)出其它產(chǎn)品,但這些產(chǎn)品本質(zhì)差不多,所要依賴的基礎(chǔ)技術(shù)會有共通的地方,主要是需要強化的點會不太一樣。這種機器人通常需要知道自己的位置,并對環(huán)境(公路、家里、酒店、園區(qū)等)進行感知,再接下來根據(jù)感知到的東西采取行動。如果需要交互那么還需自然語言處理(NLP)做支持。這里面實時知道自己的位置、對現(xiàn)實進行感知并行動是重度依賴于人工智能的點,沒人工智能上的突破這幾項不太可能做好。終極狀態(tài)就是四處能跑的和真人一樣的機器人,但現(xiàn)在限于技術(shù)水平,只可能在特定環(huán)境下進行優(yōu)化。沒地圖走路這點其實比較難,經(jīng)常提到的SLAM(即時定位與地圖構(gòu)建)指的就是這個,據(jù)說地球上能這個上搞出像樣結(jié)果的人一共也沒幾個。
服務(wù)機器人因為是限定場景,所以雖然有難度但離我們其實不遠(yuǎn),現(xiàn)實里已經(jīng)部分的走到我們生活里來了,比如iRobot的掃地機器人。
上述的自動駕駛汽車和服務(wù)機器人本質(zhì)上都可以看成是對自動化的延續(xù),但加入了感知、機器學(xué)習(xí)等來面對復(fù)雜不可以預(yù)先預(yù)知的環(huán)境(想象下現(xiàn)在在火星上跑的那車)。這里面比較濫竽充數(shù)的是工廠里的機械手,這類產(chǎn)品大多時候也還只是原本定義的自動化,只不過從形態(tài)上很容易被歸到機器人這一類別下面。實際上它們并沒有太多機器人的內(nèi)涵。Baxter等公司也在嘗試做出能學(xué)習(xí)的用于生產(chǎn)制造的機器人,但這個也還處在在路上的狀態(tài)。
數(shù)據(jù)分析和挖掘
同屬于于人工智能但又與上面所說的自動化升級差異非常大的領(lǐng)域是數(shù)據(jù)的分析和挖掘。
我們這個世界的數(shù)據(jù)化程度必然因為互聯(lián)網(wǎng)、智能硬件的發(fā)展而逐步加深,這就會導(dǎo)致海量的數(shù)據(jù)產(chǎn)生,而傳統(tǒng)的方法是不足以應(yīng)付這么大的數(shù)據(jù)量的,因此就有大數(shù)據(jù)相關(guān)的各個領(lǐng)域出來,但之前常提到的各種大數(shù)據(jù)技術(shù)比如Hadoop、Spark更像是大數(shù)據(jù)的處理的基礎(chǔ)設(shè)施,在基礎(chǔ)設(shè)施完備之后就需要有一定方法來從這些數(shù)據(jù)中挖掘出價值。人是不可能玩成這工作的,必須某種機器智能來做才行,因為大數(shù)據(jù)的價值密度一定會非常稀疏,人是不可能直接利用這些數(shù)據(jù)的。其實這也道出了現(xiàn)在所謂人工智能的一種主流驅(qū)動方式--數(shù)據(jù)驅(qū)動。這個方向上在可見范圍兩個典型的應(yīng)用是IBM的沃森和Palantir:
一、沃森
沃森的標(biāo)志性事件是在美國的一檔知名問答節(jié)目里擊敗人類選手,獲得冠軍和100萬獎金。這實在是科技界最厲害的公關(guān)事件,通過一次比賽把自己記進了人工智能的發(fā)展史,只要還有人在提人工智能那就繞不開沃森。
如果拋開商業(yè)這一面不論我們可以發(fā)現(xiàn)沃森與上面所說的自動化升級有著非常大的差異。沃森背后倒沒聯(lián)網(wǎng),但需要有15T的數(shù)據(jù)做支撐,它不太需要感知環(huán)境,但需要對語音語義有較好的理解,否則沒法搶答并回答問題。
二、行業(yè)應(yīng)用
行業(yè)應(yīng)用就更現(xiàn)實一點,體現(xiàn)的是人+人工智能的優(yōu)勢。金融公司總是要從海量數(shù)據(jù)中分析出那種行為更像是金融欺詐,廣告公司要分析轉(zhuǎn)化率,電商公司則要根據(jù)用戶行為分析如何提升銷售額等。這類工作的基本模式正如上面所說一般是有一大堆數(shù)據(jù)需要處理,數(shù)據(jù)分析師需要從這堆數(shù)據(jù)里提煉些東西出來。這時候把數(shù)據(jù)完全交給算法是很困難的,因為現(xiàn)在的人工智能算法不太可能理解很復(fù)雜的目的性,于是就需要人與人工智能的結(jié)合,人設(shè)定方向,利用某種機器智能的算法來獲得結(jié)果,和目標(biāo)進行匹配。有可能沒法一次到位,于是這一過程可能需要迭代多次,才能達到最終目的。
上面這類人工智能系統(tǒng)的兩個核心部分是海量數(shù)據(jù)的分析能力以及一個與人交互的接口。與人交互的接口因為不同場景會有變化,沃森那類系統(tǒng)需要的接口比較高級,因為需要面對完全沒有人工智能知識的人員,行業(yè)應(yīng)用的接口則需要比較低級,甚至需要暴漏底層算法來給數(shù)據(jù)分析師做選擇。這種系統(tǒng)更可能在專業(yè)領(lǐng)域展開,比如律師對過往案例的查詢、醫(yī)生對X光片的分析,一旦這種系統(tǒng)在在一般用戶級別的展開,那體現(xiàn)形式就是Siri、小娜。
解決情感問題
上述兩者的大綜合再加上擬人情感的部分才可能是斯皮爾伯格電影里演繹的那種人工智能,這種人工智能從自動化方向繼承的是感知、學(xué)習(xí)和反應(yīng),從大數(shù)據(jù)繼承的是海量數(shù)據(jù)處理,額外再加上良好的人機交互、對人類情感上的理解,最終就會形成一種伙伴型的機器人,這會是非常綜合的一種產(chǎn)品。有意思的是正因為這種綜合你不太好定位它到底適合干什么,不適合干什么。從功能上看這會是人類完整的復(fù)制品,你能干的它都能干,包括寫作、照看他人、幫你收拾屋子等等。
現(xiàn)實里人們一邊隱約感受到這方向的價值,一邊又不確切的知道具體可以用這東西來干什么,所以很多人都是在摸索前行,但技術(shù)的不成熟和剛需的不明朗確實注定了這個方向上的產(chǎn)品命運必然坎坷,比如JIBO、Pepper、Rokid。
Pepper一發(fā)布我就感覺路數(shù)不對,專門發(fā)了條微博調(diào)侃:
近來又看到有人報道老孫頭帶頭推的Pepper,這東西暫時肯定沒戲應(yīng)該是明顯的,為啥會做這個呢,不理解。
時隔半年之后,我專門到Y(jié)outube上看了下產(chǎn)品的現(xiàn)場感受以及評論,結(jié)果發(fā)現(xiàn)反饋里惡評如潮,現(xiàn)場的人們更多的是在感嘆:難しい。這詞咋一看是困難,但在那個語境里翻譯成“差點意思”更合適。視頻下方的評論中有一條最有意思:這產(chǎn)品充分的說明了孫正義和喬布斯的差距啊。
小結(jié)
這篇文章寫了人工智能的各種落地方向,沒覆蓋的是虛擬現(xiàn)實。虛擬現(xiàn)實的演化方向與上述所說的完全不同,會更傾向于建立一個像黑客帝國電影里描述的那種虛擬空間,但要想非常真實的創(chuàng)建那樣一個世界,只是蒙住眼睛顯然是不夠的,在虛擬世界的完善過程中一樣會用到人工智能的技術(shù),大致如此。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。