近日,復(fù)旦大學(xué)聯(lián)合上海人工智能實(shí)驗(yàn)室提交了一篇重磅論文,題為《LLaMa-3 8B使用蒙特卡洛樹自我優(yōu)化獲取GPT-4級(jí)別的數(shù)學(xué)奧林匹克解題方法:一份技術(shù)報(bào)告》。論文中,科研人員開發(fā)出一種名為MCTSr的算法,可以顯著提高大模型在數(shù)學(xué)和復(fù)雜推理方面的能力。這是自Q*這種神秘算法傳說以來首次有類似技術(shù)被公開發(fā)表,并且其有效性通過了可靠評(píng)估。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。