谷歌高層拜會聶衛(wèi)平。
據(jù)@央視CCTV5報道,谷歌旗下Deepmind公司近日在德國慕尼黑的DLD創(chuàng)新大會上正式宣布,將推出真正的2.0版AlphaGo。
新版“阿法狗”將正式摒棄人類棋譜,只靠計算機(jī)自身深度學(xué)習(xí)的方式成長——即探索“深度學(xué)習(xí)”方式的極限,臻至“圍棋之神”的境界。
2.0版的AlphaGo,將通過數(shù)學(xué)模型下的自我對局和深度學(xué)習(xí),下出真正屬于人工智能(AI)的圍棋。
柯潔微博。
在2017年開年,化身Master的阿法狗風(fēng)卷殘云完成60勝,唯一一場平局還是因為對弈者掉線。
當(dāng)時“棋圣”聶衛(wèi)平就表示:“圍棋遠(yuǎn)不像我們想象的那么簡單,還有巨大的空間等著我們?nèi)祟惾ネ诰?。阿法狗也好,Master也罷,都是‘圍棋上帝’派來給人類引路的。”
而柯潔則說他一夜無眠,“人類千年的實戰(zhàn)演練進(jìn)化,計算機(jī)卻告訴我們,人類全都是錯的……”
既然人類的圍棋智慧如今落入下風(fēng),那么人工智能會帶來怎么樣的圍棋變革呢?
DeepMind公司其實早已有過設(shè)想——拋棄人類棋譜套路,走AI自己的路。
阿法狗之父:哈薩比斯
該公司創(chuàng)始人哈薩比斯此前在一次采訪中曾透露,他們的團(tuán)隊正在嘗試訓(xùn)練一個沒有學(xué)習(xí)過人類棋譜的人工智能。
而當(dāng)Master大殺四方后,也有外界猜測,Master是否也未曾研習(xí)人類棋譜。
但無論是人類套路還是自成一派,阿法狗更可怕的還是它的學(xué)習(xí)能力。
在2015年10月,阿法狗在與歐洲冠軍樊麾的對弈中就在公平的情況下以5比0完勝。樊麾在接受媒體采訪時認(rèn)為,阿法狗的可怕在于“從不犯錯”。
聶衛(wèi)平和Master對弈。
在樊麾與阿法狗的五盤大戰(zhàn)棋譜被放上網(wǎng)絡(luò)后,就有不少圍棋業(yè)余高手在網(wǎng)絡(luò)上發(fā)表評論,其中不少人認(rèn)為樊麾這次的棋下得并不出色。
但當(dāng)時《自然》雜志就寫道,“人類在下棋時有一個劣勢,在長時間比賽后,他們會犯錯,但機(jī)器不會。而且人類或許一年能玩1000局,但機(jī)器一天就能玩100萬局。”
“圍棋AI的學(xué)習(xí)能力非常強大,就像當(dāng)初‘深藍(lán)’第一次輸給了卡斯帕羅夫,但不到一年第二次對弈就贏了比賽。”
韓國棋院給阿法狗頒發(fā)名譽九段證書。
據(jù)《自然》雜志介紹,阿法狗的核心是兩種不同的深度神經(jīng)網(wǎng)絡(luò):“策略網(wǎng)絡(luò)”(policy network)和 “值網(wǎng)絡(luò)”(value network)。它們的任務(wù)在于合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋。
更恐怖的是它的“進(jìn)化”深度學(xué)習(xí)能力,用了2000萬局的對子對弈進(jìn)行訓(xùn)練,每一次都能提升棋力。
分享到微信 ×
打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。