記者今天從北京智源人工智能研究院(簡(jiǎn)稱“智源研究院”)獲悉,該研究院發(fā)布了《2020人工智能十大進(jìn)展報(bào)告》,這是在全體智源學(xué)者的共同參與下,評(píng)選出過去一年里,人工智能領(lǐng)域科學(xué)系統(tǒng)、算法等方向的十大進(jìn)展。具體如下——
進(jìn)展1:OpenAI發(fā)布全球規(guī)模最大的預(yù)訓(xùn)練語言模型GPT-3
2020年5月,OpenAI發(fā)布了迄今為止全球規(guī)模最大的預(yù)訓(xùn)練語言模型GPT-3。GPT-3具有1750億參數(shù),訓(xùn)練所用的數(shù)據(jù)量達(dá)到45TB,訓(xùn)練費(fèi)用超過1200萬美元。對(duì)于所有任務(wù),應(yīng)用GPT-3無需進(jìn)行任何梯度更新或微調(diào),僅需要與模型文本交互為其指定任務(wù)和展示少量演示即可使其完成任務(wù)。GPT-3在許多自然語言處理數(shù)據(jù)集上均具有出色的性能,包括翻譯、問答和文本填空任務(wù),還包括一些需要即時(shí)推理或領(lǐng)域適應(yīng)的任務(wù)等,已在很多實(shí)際任務(wù)上大幅接近人類水平。
進(jìn)展2:DeepMind的AlphaFold2破解蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)難題
2020年11月30日,Google旗下DeepMind公司的AlphaFold2人工智能系統(tǒng)在第14屆國際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽(CASP)中取得桂冠,在評(píng)估中的總體中位數(shù)得分達(dá)到了92.4分,其準(zhǔn)確性可以與使用冷凍電子顯微鏡(CryoEM)、核磁共振或X射線晶體學(xué)等實(shí)驗(yàn)技術(shù)解析的蛋白質(zhì)3D結(jié)構(gòu)相媲美,有史以來首次把蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)任務(wù)做到了基本接近實(shí)用的水平?!蹲匀弧?Nature)雜志評(píng)論認(rèn)為,AlphaFold2算法解決了困擾生物界“50年來的大問題”。
進(jìn)展3:深度勢(shì)能分子動(dòng)力學(xué)研究獲得戈登·貝爾獎(jiǎng)
2020年11月19日,在美國亞特蘭大舉行的國際超級(jí)計(jì)算大會(huì)SC20上,智源學(xué)者、北京應(yīng)用物理與計(jì)算數(shù)學(xué)研究院王涵所在的“深度勢(shì)能”團(tuán)隊(duì),獲得了國際高性能計(jì)算應(yīng)用領(lǐng)域最高獎(jiǎng)項(xiàng)“戈登·貝爾獎(jiǎng)”。“戈登·貝爾獎(jiǎng)”設(shè)立于1987年,由美國計(jì)算機(jī)協(xié)會(huì)(ACM)頒發(fā),被譽(yù)為“計(jì)算應(yīng)用領(lǐng)域的諾貝爾獎(jiǎng)”。該團(tuán)隊(duì)研究的“分子動(dòng)力學(xué)”,結(jié)合了分子建模、機(jī)器學(xué)習(xí)和高性能計(jì)算相關(guān)方法,能夠?qū)⒌谝恍栽砭确肿觿?dòng)力學(xué)模擬規(guī)模擴(kuò)展到1億原子,同時(shí)計(jì)算效率相比此前人類最好水平提升1000倍以上,極大地提升了人類使用計(jì)算機(jī)模擬客觀物理世界的能力。美國計(jì)算機(jī)協(xié)會(huì)(ACM)評(píng)價(jià)道,基于深度學(xué)習(xí)的分子動(dòng)力學(xué)模擬通過機(jī)器學(xué)習(xí)和大規(guī)模并行的方法,將精確的物理建模帶入了更大尺度的材料模擬中,將來有望為力學(xué)、化學(xué)、材料、生物乃至工程領(lǐng)域解決實(shí)際問題(如大分子藥物開發(fā))發(fā)揮更大作用。
進(jìn)展4:DeepMind等用深度神經(jīng)網(wǎng)絡(luò)求解薛定諤方程促進(jìn)量子化學(xué)發(fā)展
薛定諤方程是量子力學(xué)的基本方程,即便已經(jīng)提出70多年,能夠精確求解薛定諤方程的方法少之又少,多年來科學(xué)家們一直在努力攻克這一難題。2019年,DeepMind開發(fā)出一種費(fèi)米神經(jīng)網(wǎng)絡(luò)(Fermionic neural networks,簡(jiǎn)稱FermiNet)來近似計(jì)算薛定諤方程,為深度學(xué)習(xí)在量子化學(xué)領(lǐng)域的發(fā)展奠定了基礎(chǔ),2020年10月,DeepMind開源了FermiNet,相關(guān)論文發(fā)表在物理學(xué)期刊Physical Review Research上。FermiNet是第一個(gè)利用深度學(xué)習(xí)來從第一性原理計(jì)算原子和分子能量的嘗試,在精度和準(zhǔn)確性上都滿足科研標(biāo)準(zhǔn),且是目前在相關(guān)領(lǐng)域中最為精準(zhǔn)的神經(jīng)網(wǎng)絡(luò)模型。另外,2020年9月,德國柏林自由大學(xué)的幾位科學(xué)家也提出了一種新的深度學(xué)習(xí)波函數(shù)擬設(shè)方法,它可以獲得電子薛定諤方程的近乎精確解,相關(guān)研究發(fā)表在Nature Chemistry上。該類研究所展現(xiàn)的,不僅是深度學(xué)習(xí)在解決某一特定科學(xué)問題過程中的應(yīng)用,也是深度學(xué)習(xí)能在生物、化學(xué)、材料以及醫(yī)藥領(lǐng)域等各領(lǐng)域科研中被廣泛應(yīng)用的一個(gè)遠(yuǎn)大前景。
進(jìn)展5:美國貝勒醫(yī)學(xué)院通過動(dòng)態(tài)顱內(nèi)電刺激實(shí)現(xiàn)高效率“視皮層打印機(jī)”功能
對(duì)于全球4000多萬盲人來說,重見光明是一個(gè)遙不可及的夢(mèng)想。2020年5月,美國貝勒醫(yī)學(xué)院的研究者利用動(dòng)態(tài)顱內(nèi)電刺激新技術(shù),用植入的微電極陣列構(gòu)成視覺假體,在人類初級(jí)視皮層繪制W、S和Z等字母的形狀,成功地能夠讓盲人“看見”了這些字母。結(jié)合馬斯克創(chuàng)辦的腦機(jī)接口公司Neuralink發(fā)布的高帶寬、全植入式腦機(jī)接口系統(tǒng),下一代視覺假體有可能精準(zhǔn)刺激大腦初級(jí)視覺皮層的每一個(gè)神經(jīng)元,幫助盲人“看見”更復(fù)雜的信息,實(shí)現(xiàn)他們看清世界的夢(mèng)想。
進(jìn)展6:清華大學(xué)首次提出類腦計(jì)算完備性概念及計(jì)算系統(tǒng)層次結(jié)構(gòu)
2020年10月,智源學(xué)者,清華大學(xué)張悠慧、李國齊、宋森團(tuán)隊(duì)首次提出“類腦計(jì)算完備性”概念以及軟硬件去耦合的類腦計(jì)算系統(tǒng)層次結(jié)構(gòu),通過理論論證與原型實(shí)驗(yàn)證明該類系統(tǒng)的硬件完備性與編譯可行性,擴(kuò)展類腦計(jì)算系統(tǒng)應(yīng)用范圍使之能支持通用計(jì)算。該研究成果發(fā)表在2020年10月14日的《自然》(Nature)期刊?!蹲匀弧分芸u(píng)論認(rèn)為,“‘完備性’新概念推動(dòng)了類腦計(jì)算”,對(duì)于類腦系統(tǒng)存在的軟硬件緊耦合問題而言這是“一個(gè)突破性方案”。
進(jìn)展7:北京大學(xué)首次實(shí)現(xiàn)基于相變存儲(chǔ)器的神經(jīng)網(wǎng)絡(luò)高速訓(xùn)練系統(tǒng)
2020年12月,智源學(xué)者、北京大學(xué)楊玉超團(tuán)隊(duì)提出并實(shí)現(xiàn)了一種基于相變存儲(chǔ)器(PCM)電導(dǎo)隨機(jī)性的神經(jīng)網(wǎng)絡(luò)高速訓(xùn)練系統(tǒng),有效地緩解了人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中時(shí)間、能量開銷巨大并難以在片上實(shí)現(xiàn)的問題。該系統(tǒng)在誤差直接回傳算法(DFA)的基礎(chǔ)上進(jìn)行改進(jìn),利用PCM電導(dǎo)的隨機(jī)性自然地產(chǎn)生傳播誤差的隨機(jī)權(quán)重,有效降低了系統(tǒng)的硬件開銷以及訓(xùn)練過程中的時(shí)間、能量消耗。該系統(tǒng)在大型卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中表現(xiàn)優(yōu)異,為人工神經(jīng)網(wǎng)絡(luò)在終端平臺(tái)上的應(yīng)用以及片上訓(xùn)練的實(shí)現(xiàn)提供了新的方向。
進(jìn)展8:MIT僅用19個(gè)類腦神經(jīng)元實(shí)現(xiàn)控制自動(dòng)駕駛汽車
受秀麗隱桿線蟲等小型動(dòng)物腦的啟發(fā),來自MIT計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)、維也納工業(yè)大學(xué)、奧地利科技學(xué)院的團(tuán)隊(duì)僅用19個(gè)類腦神經(jīng)元就實(shí)現(xiàn)了控制自動(dòng)駕駛汽車,而常規(guī)的深度神經(jīng)網(wǎng)絡(luò)則需要數(shù)百萬神經(jīng)元。此外,這一神經(jīng)網(wǎng)絡(luò)能夠模仿學(xué)習(xí),具有擴(kuò)展到倉庫的自動(dòng)化機(jī)器人等應(yīng)用場(chǎng)景的潛力。這一研究成果已發(fā)表在2020年10月13日的《自然》雜志子刊《自然·機(jī)器智能》(Nature Machine Intelligence)上。
進(jìn)展9:Google與FaceBook團(tuán)隊(duì)分別提出全新無監(jiān)督表征學(xué)習(xí)算法
2020年初,Google與Facebook分別提出SimCLR與MoCo兩個(gè)算法,均能夠在無標(biāo)注數(shù)據(jù)上學(xué)習(xí)圖像數(shù)據(jù)表征。兩個(gè)算法背后的框架都是對(duì)比學(xué)習(xí)(contrastive learning)。對(duì)比學(xué)習(xí)的核心訓(xùn)練信號(hào)是圖片的“可區(qū)分性”。模型需要區(qū)分兩個(gè)輸入是來自于同一圖片的不同視角,還是來自完全不同的兩張圖片的輸入。這個(gè)任務(wù)不需要人類標(biāo)注,因此可以使用大量無標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練。盡管Google和FaceBook的兩個(gè)工作對(duì)很多訓(xùn)練的細(xì)節(jié)問題進(jìn)行了不同的處理,但它們都表明,無監(jiān)督學(xué)習(xí)模型可以接近甚至達(dá)到有監(jiān)督模型的效果。
進(jìn)展10:康奈爾大學(xué)提出無偏公平排序模型可緩解檢索排名的馬太效應(yīng)問題
近年來,檢索的公平性和基于反事實(shí)學(xué)習(xí)的檢索和推薦模型已經(jīng)成為信息檢索領(lǐng)域重要的研究方向,相關(guān)的研究成果已經(jīng)被廣泛應(yīng)用于點(diǎn)擊數(shù)據(jù)糾偏、模型離線評(píng)價(jià)等,部分技術(shù)已經(jīng)落地于阿里和華為等公司的推薦及搜索產(chǎn)品中。2020年7月,康奈爾大學(xué)Thorsten Joachims教授團(tuán)隊(duì)發(fā)表了公平無偏的排序?qū)W習(xí)模型FairCo,一舉奪得了國際信息檢索領(lǐng)域頂會(huì)SIGIR 2020最佳論文獎(jiǎng)。該研究分析了當(dāng)前排序模型普遍存在的位置偏差、排序公平性以及物品曝光的馬太效應(yīng)問題等,基于反事實(shí)學(xué)習(xí)技術(shù)提出了具有公平性約束的相關(guān)度無偏估計(jì)方法,并實(shí)現(xiàn)了排序性能的提升,受到業(yè)界的廣泛關(guān)注和好評(píng)。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。