北京1月27日電 ,英國《自然》雜志27日公開的論文,報(bào)道了一種能在傳統(tǒng)策略游戲——圍棋上擊敗專業(yè)選手的電腦程序。圍棋被認(rèn)為是人工智能領(lǐng)域一個(gè)非常具有標(biāo)志性的“大挑戰(zhàn)”,這項(xiàng)成果可能會給人工智能領(lǐng)域其他看似難以實(shí)現(xiàn)的人類級別能力的項(xiàng)目帶來希望。
現(xiàn) 在的國際象棋領(lǐng)域,人類頂尖選手都會被電腦殺得丟盔棄甲,圍棋則不然。圍棋起源于中國,兩個(gè)選手在矩形格子上交換下黑子和白子,目標(biāo)是在比賽結(jié)束時(shí)比對方 占領(lǐng)更多的地盤。正是源于圍棋巨大的搜索空間,很難估計(jì)局面和下子,讓圍棋被視作人工智能領(lǐng)域“難以搞定”的標(biāo)志性項(xiàng)目。迄今最成功的圍棋計(jì)算機(jī)程序,能 達(dá)到業(yè)余人類選手的程度,但還不能和專業(yè)選手在不讓子的情況下一較高下。
此次,位于英國倫敦的谷歌旗下DeepMind公司的戴維·西爾弗、艾佳·黃和杰米斯·哈薩比斯與他們的團(tuán)隊(duì),開發(fā)了一個(gè)叫“AlphaGo”的程序,利用“價(jià)值網(wǎng)絡(luò)”去計(jì)算局面,用“策略網(wǎng)絡(luò)”去選擇下子。訓(xùn)練這些深度神經(jīng)網(wǎng)絡(luò)的,是對人類專業(yè)棋局的監(jiān)督學(xué)習(xí)以及讓它和自己對弈的增強(qiáng)學(xué)習(xí)。
“AlphaGo”程序在和其他圍棋程序的對抗中獲得了99.8%的勝率,并且在一項(xiàng)競賽中以5比0的成績戰(zhàn)勝了歐洲圍棋冠軍。計(jì)算機(jī)程序能在不讓子的情況下,在完整的圍棋游戲中擊敗專業(yè)選手,這還是第一次。原本人們認(rèn)為,要到10年后人工智能才能達(dá)到這一成就。
“AlphaGo”程序的下一個(gè)挑戰(zhàn)對象將是過去10年來的世界圍棋冠軍李世石。這場人工智能與人類的博弈將于3月份在首爾舉行。(據(jù)了解,這次比賽獎(jiǎng)金由谷歌提供,共100萬美元。)
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。