根據(jù)英國(guó)《自然》雜志3日發(fā)表的一項(xiàng)計(jì)算機(jī)科學(xué)最新突破,加拿大科學(xué)家團(tuán)隊(duì)報(bào)告:完全由人工智能控制的氣球,成功實(shí)現(xiàn)自主導(dǎo)航,在平流層一連數(shù)周待在原地。這一成果標(biāo)志著深度強(qiáng)化學(xué)習(xí)向現(xiàn)實(shí)應(yīng)用邁出了重要且非常難得的一步,同時(shí)提高了人類(lèi)全自動(dòng)環(huán)境監(jiān)測(cè)的可能性。
人工智能在氣象領(lǐng)域的應(yīng)用,正在爆發(fā)式增長(zhǎng),并且呈現(xiàn)出由傳統(tǒng)的機(jī)器學(xué)習(xí)向深度學(xué)習(xí)發(fā)展的趨勢(shì)。通常,填充氦氣的超壓氣球常被用于高層大氣實(shí)驗(yàn),如氣象監(jiān)測(cè),但如果被風(fēng)吹偏了航道,它們必須要返回原駐點(diǎn),而深度強(qiáng)化學(xué)習(xí)可以訓(xùn)練人工智能系統(tǒng)進(jìn)行決策——對(duì)于超壓氣球來(lái)說(shuō),這些主動(dòng)決策就包括采取哪些行動(dòng)來(lái)保持它們的位置不變。
此次,加拿大谷歌研究院科學(xué)家馬克·貝爾麥爾及其同事,訓(xùn)練了一種人工智能控制器,能根據(jù)風(fēng)的歷史記錄、預(yù)報(bào)、局地風(fēng)觀測(cè)和其他因素(如氦氣損失和電池疲勞),決定是否要移動(dòng)氣球。
研究團(tuán)隊(duì)利用一種數(shù)據(jù)增強(qiáng)算法來(lái)解釋數(shù)據(jù)中的空白。他們將這一新成果——名為“StationSeeker”的技術(shù)應(yīng)用到分布在全球各地的“Loon氣球”上,包括一項(xiàng)在太平洋上空進(jìn)行的為期39天的受控實(shí)驗(yàn)。“Loon氣球”原本是一個(gè)互聯(lián)網(wǎng)項(xiàng)目,團(tuán)隊(duì)將高空超壓氣球發(fā)放至平流層,組成空中的無(wú)線網(wǎng)絡(luò)。而貝爾麥爾的實(shí)驗(yàn)證明,受到“StationSeeker”控制的氣球能成功實(shí)現(xiàn)自主導(dǎo)航,一旦被吹偏航道,它們能比傳統(tǒng)控制器控制的氣球更快地回到原駐點(diǎn)。
深度強(qiáng)化學(xué)習(xí)的應(yīng)用此前已在受控環(huán)境——如電腦游戲中得到了演示,但在受控環(huán)境中,擁有完整的數(shù)據(jù)集和明確定義的參數(shù)。而在現(xiàn)實(shí)世界中,可預(yù)測(cè)性變得更差,比如關(guān)于環(huán)境中風(fēng)的數(shù)據(jù)就不完整,因此很難采取最優(yōu)調(diào)整而讓氣球保持在原位。
在一篇同時(shí)發(fā)表的“新聞與觀點(diǎn)”文章中,英國(guó)牛津大學(xué)科學(xué)家斯科特·奧斯佩爾表示,正是由于這一理由,此次最新成果可以說(shuō)代表了增強(qiáng)學(xué)習(xí)在現(xiàn)實(shí)世界應(yīng)用的一次巨大進(jìn)步。
分享到微信 ×
打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。