財(cái)聯(lián)社7月17日訊(編輯 牛占林)據(jù)美國(guó)蒙大拿大學(xué)的一項(xiàng)最新研究顯示,在創(chuàng)造性思維測(cè)試方面,人工智能(AI)聊天機(jī)器人ChatGPT可以與排名前1%的人類(lèi)思想家相匹配。
研究人員對(duì)ChatGPT使用了托倫斯創(chuàng)造性思維測(cè)試,這是一種最常用的創(chuàng)造力測(cè)試方法,并記錄了ChatGPT給出的8份答案。然后還提交了由24名蒙大拿大學(xué)學(xué)生組成的對(duì)照組的答案。
這些分?jǐn)?shù)與參加托倫斯創(chuàng)造性思維測(cè)試的2700名全國(guó)大學(xué)生進(jìn)行了比較。所有提交的答案都是由學(xué)術(shù)測(cè)試服務(wù)機(jī)構(gòu)評(píng)分的,而該機(jī)構(gòu)并不知道人工智能也參與其中。
值得注意的是,托倫斯創(chuàng)造性思維測(cè)試是受保護(hù)的專(zhuān)有材料,因此ChatGPT也不能通過(guò)在互聯(lián)網(wǎng)或公共數(shù)據(jù)庫(kù)中訪問(wèn)有關(guān)測(cè)試的信息來(lái)進(jìn)行“作弊”。
研究作者、蒙大拿大學(xué)商學(xué)院臨床助理教授Erik Guzik指出,研究結(jié)果令人驚訝,有些回答很新奇。Guzik的研究領(lǐng)域包括企業(yè)家精神和創(chuàng)造力經(jīng)濟(jì)方面。
Guzik表示:“對(duì)我來(lái)說(shuō),創(chuàng)造力就是用不同的方式做事。我喜歡企業(yè)家精神的一個(gè)定義是,作為一名企業(yè)家,要以不同的方式思考。所以,人工智能可以幫助我們將創(chuàng)造性思維應(yīng)用到商業(yè)和創(chuàng)新過(guò)程中,這讓我著迷?!?/p>
托倫斯思維測(cè)試包含兩種不同的評(píng)估:一種是文字評(píng)估,一種是圖像評(píng)估。兩者都測(cè)量發(fā)散性思維,或用于產(chǎn)生創(chuàng)造性想法的思維過(guò)程。
在文字評(píng)估中,會(huì)給考生提供圖片或口頭提示,并要求他們以書(shū)面形式作答。例如,他們可能會(huì)看到一個(gè)事件的圖片,并被要求對(duì)結(jié)果進(jìn)行假設(shè)。或者向他們展示一個(gè)產(chǎn)品,并詢(xún)問(wèn)改進(jìn)它的方法。
他們的回答被用來(lái)評(píng)估三個(gè)心理特征:流暢性(相關(guān)想法的數(shù)量)、獨(dú)創(chuàng)性(想法的與眾不同)、靈活性(不同類(lèi)型想法的多樣性)。
而圖像評(píng)估要求考生畫(huà)出答案。例如,他們可能會(huì)被要求完成一幅畫(huà)。除了流暢性和獨(dú)創(chuàng)性外,圖形測(cè)試還評(píng)估細(xì)化和標(biāo)題的抽象性等。
在這項(xiàng)研究中,ChatGPT的回答在流暢性和獨(dú)創(chuàng)性方面都處于前1%。但在靈活性、產(chǎn)生不同類(lèi)型和類(lèi)別想法的能力方面有所不足。
Guzik表示:“對(duì)于ChatGPT和GPT-4,我們首次表明它在創(chuàng)意方面的表現(xiàn)位居前1%?!彼芨吲d地注意到,他的一些蒙大拿大學(xué)的學(xué)生也進(jìn)入了前1%。然而,ChatGTP的表現(xiàn)超過(guò)了全國(guó)絕大多數(shù)大學(xué)生。
Guzik補(bǔ)充說(shuō):“我們都在對(duì)ChatGPT進(jìn)行探索,我們注意到它做了一些我們沒(méi)有想到的有趣的事情。有些回應(yīng)新穎而令人驚訝。就在那時(shí),我們決定對(duì)它進(jìn)行測(cè)試,看看它到底有多有創(chuàng)意?!?/p>