最近,加州大學(xué)圣迭戈分校的研究人員進(jìn)行了一項(xiàng)名為圖靈測(cè)試的研究,旨在評(píng)估機(jī)器展現(xiàn)出人類智能的程度。他們的研究結(jié)果發(fā)現(xiàn),人們?cè)谂c GPT-4模型和人類代理進(jìn)行兩人對(duì)話時(shí),很難區(qū)分兩者。
研究論文提前發(fā)布在 arXiv 服務(wù)器上,其結(jié)果顯示 GPT-4在大約50% 的互動(dòng)中能夠被誤認(rèn)為是人類。盡管初步實(shí)驗(yàn)并未充分控制影響結(jié)果的一些變量,但他們決定進(jìn)行第二項(xiàng)實(shí)驗(yàn),以得出更詳實(shí)的結(jié)果。
在他們的研究中,人們難以確定 GPT-4是否為人類。與 GPT-3.5和 ELIZA 模型相比,人們往往能夠判斷出后者是機(jī)器,但在判斷 GPT-4是人類還是機(jī)器上,他們的能力并不比隨機(jī)猜測(cè)更高。
研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)名為 "人還是不是人" 的二人在線游戲,讓參與者與另一個(gè)人或一個(gè) AI 模型進(jìn)行互動(dòng)。每次游戲中,一個(gè)人類詢問者與一個(gè) “證人” 進(jìn)行交談,以試圖確定對(duì)方是否為人類。
雖然真正的人類其實(shí)更成功,有約三分之二的時(shí)間說服詢問者他們是人類,但研究結(jié)果表明,在現(xiàn)實(shí)世界中,人們可能無法可靠地判斷他們是否在與人類還是 AI 系統(tǒng)交談。
分享到微信 ×
打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。