3月10日,人機(jī)世紀(jì)大戰(zhàn)迎來第二場較量,這場較量注定會備受矚目。
在此前的3月9日,人機(jī)世紀(jì)大戰(zhàn)第一場結(jié)果出乎大多數(shù)人的意料,谷歌(微博)人工智能系統(tǒng)AlphaGo竟然在局勢不利的情況下,挑戰(zhàn)世界圍棋冠軍李世石成功,李世石則投子認(rèn)輸。
很多人認(rèn)為李世石故意放水,李世石則在隨后的發(fā)布會中表示,“比賽中有兩件事讓我吃驚,一個是AlphaGo開局下得非常好,第二個是在比賽過程中不斷有一些令我想不到的下法。”
李世石說,“我沒想到過我會輸。我覺得我一開始犯的那個失誤一直伴隨到了最后,成了我失利最主要的原因”。
創(chuàng)新工場CEO李開復(fù)則在這場比賽棋至中盤時就點(diǎn)出李世石的問題:李世石在嘗試新打法,這非常不明智。比較好的打法是按照經(jīng)典標(biāo)準(zhǔn),以過去專家打法來,會比鋌而走險更穩(wěn)當(dāng)。
圍棋九段、中國國家隊著名國手江鑄久指出,從李世石布局階段就能看出來,他今天在心理上一開始就有波動,因為他采取的是非正常的布局。這也說明AlphaGo這5個月進(jìn)步很快。
李世石敗給AlphaGo的背后,是人性與機(jī)器的較量。分析稱,真正讓人感到害怕的不是AlphaGo的棋力,而是它的沒有情緒、不知疲倦、沉著冷靜。這與AI無關(guān),是機(jī)器的本性。
求穩(wěn)讓李世石犯下致命錯誤
這場谷歌AlphaGo對抗世界圍棋冠軍李世石的較量,從一開始就像一場在刀鋒上的比賽。
開局之初,AlphaGo與李世石的對攻就顯得驚心動魄,一度AlphaGo還處于領(lǐng)先位置,不過,在“開戰(zhàn)”2個小時后,李世石的優(yōu)勢逐漸開始明顯,AlphaGo陷入到劣勢。
古力九段點(diǎn)評說,從今天來看,AlphaGo圍棋水平比歐洲冠軍樊麾要強(qiáng),已經(jīng)具備職業(yè)強(qiáng)手的素質(zhì),但在細(xì)節(jié)方面剛好離專業(yè)差一點(diǎn)。AlphaGo應(yīng)該是處于業(yè)余六七段的水平。
AlphaGo最兇險的時候,古力九段和柯潔九段已做出預(yù)測,這一盤棋,AlphaGo基本上輸了,“如果是個人類選手,基本上已經(jīng)可以投子認(rèn)輸。”
在巨大的劣勢中,AlphaGo突然又開始抗?fàn)?,最后反而越?zhàn)越勇,后發(fā)而至,與李世石又形成僵持局面,甚至占有優(yōu)勢。李世石面臨的局勢又變得非常兇險。
而贏面非常大的情況下,李世石過于求穩(wěn),反而被AlphaGo追上,且出現(xiàn)明顯失誤,損失三目棋?,F(xiàn)場解說員表示,AlphaGo與李世石這一番廝殺,他都受不了了。
.
一直到下午3點(diǎn)30分,李世石投子認(rèn)輸。在這場長達(dá)3個半小時的對抗賽中,AlphaGo贏得最終勝利,李世石情緒、體力、心理波動等人性弱點(diǎn)對棋局結(jié)果的影響不可低估。
一位圍棋界人士點(diǎn)評說,李世石并不輸在棋力,而是輸在獲得優(yōu)勢以后的輕敵,以及之后所犯的錯誤。盡管AlphaGo也曾出現(xiàn)失誤,但在李世石遭遇的失誤面前這些失誤可忽略不計。
相比AlphaGo,李世石更聰明、棋力更深厚,但AlphaGo的優(yōu)點(diǎn)是,情緒控制更好,它不會緊張,不會嘚瑟,不會沮喪,也不會體力下降。AlphaGo更像是一位棋力比他稍差的忍者。
實(shí)際上,圍棋手和圍棋手之間的較量,圍棋手與機(jī)器之間的較量有很大的不同。
兩個人下棋的時候,棋手常常會觀察和琢磨對方情感和心理。對方是緊張了,害怕了,你在想象對方的同時,這種作用對方也會感到到,折射回來。但和機(jī)器下棋,這個就顯得很別扭。
更可怕的是,AlphaGo有很強(qiáng)的學(xué)習(xí)能力,基本沒套路可尋。歐洲圍棋冠軍樊麾曾對騰訊科技表示,面對機(jī)器就像面對一堵墻,所有感覺全部都被打了回來,機(jī)器卻沒有心態(tài)的波動。
克服人性弱點(diǎn)是戰(zhàn)勝AlphaGo的關(guān)鍵
資料顯示,AlphaGo使用蒙特卡洛樹搜索算法,借助值網(wǎng)絡(luò)與策略網(wǎng)絡(luò)這兩種深度神經(jīng)網(wǎng)絡(luò),通過值網(wǎng)絡(luò)來評估大量選點(diǎn),并通過策略網(wǎng)絡(luò)選擇落點(diǎn)。
機(jī)器最初通過模仿人類玩家,嘗試匹配職業(yè)棋手的棋局,一旦它達(dá)到了一定的熟練程度,它開始和自己對弈大量棋局,使用強(qiáng)化學(xué)習(xí)進(jìn)一步改善它。
作為一個大數(shù)據(jù)專家,陳利人認(rèn)為,人類不可能不犯錯,而機(jī)器不會犯錯。棋局中說到的機(jī)器犯錯,是人類理解的犯錯,而這些選擇,是機(jī)器精確計算后的結(jié)果。
陳利人說,最后我們看到的局部戰(zhàn)斗,機(jī)器的絕對優(yōu)勢發(fā)揮淋漓盡致。人類經(jīng)常只能看勢,模糊估算。但機(jī)器在小的搜索空間,完全可以精確計算,找出最優(yōu)的選擇。
“機(jī)器下出的不符合通常人類認(rèn)可的模式,給人類造成了很大的困擾。人類在沒有模式可follow的情況下,嘗試新的下法,出錯(失算)的概率很大,也有可能造成心理的負(fù)擔(dān)。”
盡管李世石輸?shù)袅耸讏霰荣?,但此次人機(jī)世紀(jì)大戰(zhàn)一共分為5場,還有4場,分別是3月10日、3月12日、3月13日和3月15日。依然有很多人對李世石獲得勝利很有信心。
資深研究員戴文淵認(rèn)為,和AlphaGo對抗時人類需要注意幾點(diǎn):
1,AlphaGo所基于的人工智能技術(shù),強(qiáng)項不在于推演,而是借鑒過去見過的局面。所以,如果要擊敗AlphaGo,需要盡可能把局面導(dǎo)向歷史上沒人下過的棋。
2,圍棋的邊角戰(zhàn)斗靠計算,中空戰(zhàn)斗靠感覺。既然感覺占優(yōu),那就一定要盡量把勝負(fù)手留在棋盤中間??孔?ldquo;勢”取勝,而不是把戰(zhàn)火引到邊角實(shí)地。
3,一旦進(jìn)入到局部纏斗,盡早將局部肉搏戰(zhàn)打完,不要留出大量小區(qū)域短兵相接的局面,保持局面盡可能大開大合。
此外,需要格外小心的是,一定要克服自己人性的弱點(diǎn)。局面領(lǐng)先時,避免驕傲;落后時,避免氣餒;膠著時,避免緊張。
戴文淵認(rèn)為,李世石如果能在后面幾局注意控制自己的心魔,依然可以扳回不利的局面。
古力九段認(rèn)為,這盤棋在細(xì)微的地方機(jī)器跟人還是有區(qū)別,AlphaGo要吃虧一些,但李世石也存在很大的失誤,就是在戰(zhàn)局的右邊,當(dāng)形勢一片大好的時候,人出現(xiàn)了松懈。
“由于前面有樂觀心態(tài),他連自己最擅長的拼搏都沒有了,而是選擇安樂的輸棋,這讓我們對他今天的發(fā)揮比較失望。這次失敗也會對他敲了警鐘,我對他第二場的發(fā)揮比較期待。”
盡管輸?shù)舯荣?,李世石在隨后也表示,經(jīng)過第一場比賽,覺得第二場比賽的勝負(fù)會是五五開。
在這場谷歌AlphaGo對抗世界圍棋冠軍李世石之后,一場新的較量或許也在醞釀。第一場賽后,李世石的對手柯潔發(fā)微博表示,“就算阿法狗戰(zhàn)勝了李世石,但它贏不了我。”
盡管是1997年出身,但柯潔在2015年世界大賽已豪取三冠,與李世石的交往戰(zhàn)績是8勝2負(fù)。不久前剛結(jié)束的農(nóng)心杯三國擂臺賽上,柯潔作為主將還力克李世石助中國隊捧杯。
谷歌AlphaGo似乎也將目標(biāo)標(biāo)準(zhǔn)了中國棋手,準(zhǔn)備在挑戰(zhàn)李世石后,再展開一場較量。AlphaGo圍棋創(chuàng)始人哈薩比斯稱,希望AlphaGo能與中國的高水平棋手對弈,比如柯潔。
“其實(shí)我覺得這次棋誰贏誰輸不是最重要的。”李開復(fù)說,一旦AlphaGo達(dá)到專業(yè)二段的水平以后,打敗人類只是遲早的事,這個時間點(diǎn)可能最快只要6個月到2年的時間就能到來。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。