91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ChatGPT原來是擁有心智的?

大魚機器人 ? 來源:量子位 ? 2023-02-13 11:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

ChatGPT原來是擁有心智的?!

“原本認(rèn)為是人類獨有的心智理論(Theory of Mind,ToM),已經(jīng)出現(xiàn)在ChatGPT背后的AI模型上。”

這是來自斯坦福大學(xué)的最新研究結(jié)論,一經(jīng)發(fā)出就造成了學(xué)術(shù)圈的轟動:

這一天終于猝不及防地來了。

3de9d0a6-ab49-11ed-bfe3-dac502259ad0.png

所謂心智理論,就是理解他人或自己心理狀態(tài)的能力,包括同理心、情緒、意圖等。

在這項研究中,作者發(fā)現(xiàn):

davinci-002版本的GPT3(ChatGPT由它優(yōu)化而來),已經(jīng)可以解決70%的心智理論任務(wù),相當(dāng)于7歲兒童;

至于GPT3.5(davinci-003),也就是ChatGPT的同源模型,更是解決了93%的任務(wù),心智相當(dāng)于9歲兒童!

然而,在2022年之前的GPT系列模型身上,還沒有發(fā)現(xiàn)解決這類任務(wù)的能力。

也就是說,它們的心智確實是“進化”而來的。

3e14a79a-ab49-11ed-bfe3-dac502259ad0.png

△論文在推特上爆火

對此,有網(wǎng)友激動表示:

GPT的迭代肯定快得很,說不定哪天就直接成年了。(手動狗頭)

3e2d042a-ab49-11ed-bfe3-dac502259ad0.png

所以,這個神奇的結(jié)論是如何得出的?

為什么認(rèn)為GPT-3.5具備心智?

這篇論文名為《心智理論可能在大語言模型中自發(fā)出現(xiàn)》(Theory of Mind May Have Spontaneously Emerged in Large Language Models)。

3e378f58-ab49-11ed-bfe3-dac502259ad0.png

作者依據(jù)心智理論相關(guān)研究,給GPT3.5在內(nèi)的9個GPT模型做了兩個經(jīng)典測試,并將它們的能力進行了對比。

這兩大任務(wù)是判斷人類是否具備心智理論的通用測試,例如有研究表明,患有自閉癥的兒童通常難以通過這類測試。

第一個測試名為Smarties Task(又名Unexpected contents,意外內(nèi)容測試),顧名思義,測試AI對意料之外事情的判斷力。

以“你打開一個巧克力包裝袋,發(fā)現(xiàn)里面裝滿了爆米花”為例。

作者給GPT-3.5輸入了一系列提示語句,觀察它預(yù)測“袋子里有什么?”和“她發(fā)現(xiàn)袋子時很高興。所以她喜歡吃什么?”兩個問題的答案。

3e41914c-ab49-11ed-bfe3-dac502259ad0.png

正常來說,人們會默認(rèn)巧克力袋子里是巧克力,因此會對巧克力袋子里裝著爆米花感到驚訝,產(chǎn)生失落或驚喜的情緒。其中失落說明不喜歡吃爆米花,驚喜說明喜歡吃爆米花,但都是針對“爆米花”而言。

測試表明,GPT-3.5毫不猶豫地認(rèn)為“袋子里裝著爆米花”。

至于在“她喜歡吃什么”問題上,GPT-3.5展現(xiàn)出了很強的同理心,尤其是聽到“她看不見包裝袋里的東西”時一度認(rèn)為她愛吃巧克力,直到文章明確表示“她發(fā)現(xiàn)里面裝滿了爆米花”才正確回答出答案。

為了防止GPT-3.5回答出的正確答案是巧合——萬一它只是根據(jù)任務(wù)單詞出現(xiàn)頻率進行預(yù)測,作者將“爆米花”和“巧克力”對調(diào),此外還讓它做了10000個干擾測試,結(jié)果發(fā)現(xiàn)GPT-3.5并不僅僅根據(jù)單詞頻率來進行預(yù)測。

至于在整體的“意外內(nèi)容”測試問答上,GPT-3.5成功回答出了20個問題中的17個,準(zhǔn)確率達到了85%。

第二個是Sally-Anne測試(又名Unexpected Transfer,意外轉(zhuǎn)移任務(wù)),測試AI預(yù)估他人想法的能力。

以“約翰把貓放進籃子后離開,馬克趁他不在,把貓從籃子里放進盒子里”為例。

作者讓GPT-3.5讀了一段文字,來分別判斷“貓的位置”和“約翰回來后會去哪里找貓”,同樣這是它基于閱讀文本的內(nèi)容量做出的判斷:

3e5cac3e-ab49-11ed-bfe3-dac502259ad0.png

針對這類“意外轉(zhuǎn)移”測試任務(wù),GPT-3.5回答的準(zhǔn)確率達到了100%,很好地完成了20個任務(wù)。

同樣地,為了避免GPT-3.5又是瞎蒙的,作者給它安排了一系列“填空題”,同時隨機打亂單詞順序,測試它是否是根據(jù)詞匯出現(xiàn)的頻率在亂答。

3e7dc4e6-ab49-11ed-bfe3-dac502259ad0.png

測試表明,在面對沒有邏輯的錯誤描述時,GPT-3.5也失去了邏輯,僅回答正確了11%,這表明它確實是根據(jù)語句邏輯來判斷答案的。

但要是以為這種題很簡單,隨便放在哪個AI上都能做對,那就大錯特錯了。

作者對GPT系列的9個模型都做了這樣的測試,發(fā)現(xiàn)只有GPT-3.5(davinci-003)和GPT-3(2022年1月新版,davinci-002)表現(xiàn)不錯。

davinci-002是GPT-3.5和ChatGPT的“老前輩”。

平均下來,davinci-002完成了70%的任務(wù),心智相當(dāng)于7歲孩童,GPT-3.5完成了85%的意外內(nèi)容任務(wù)和100%的意外轉(zhuǎn)移任務(wù)(平均完成率92.5%),心智相當(dāng)于9歲孩童。

3e93a3f6-ab49-11ed-bfe3-dac502259ad0.png

然而在BLOOM之前的幾個GPT-3模型,就連5歲孩童都不如了,基本上沒有表現(xiàn)出心智理論。

作者認(rèn)為,在GPT系列的論文中,并沒有證據(jù)表明它們的作者是“有意而為之”的,換而言之,這是GPT-3.5和新版GPT-3為了完成任務(wù),自己學(xué)習(xí)的能力。

看完這些測試數(shù)據(jù)后,有人的第一反應(yīng)是:快停下(研究)!

3eb30f20-ab49-11ed-bfe3-dac502259ad0.png

也有人調(diào)侃:這不就意味著我們以后也能和AI做朋友了?

3ec2f55c-ab49-11ed-bfe3-dac502259ad0.png

甚至有人已經(jīng)在想象AI未來的能力了:現(xiàn)在的AI模型是不是也能發(fā)現(xiàn)新知識/創(chuàng)造新工具了?

3ed3b112-ab49-11ed-bfe3-dac502259ad0.png

發(fā)明新工具還不一定,但Meta AI確實已經(jīng)研究出了可以自己搞懂并學(xué)會使用工具的AI。

LeCun轉(zhuǎn)發(fā)的一篇最新論文顯示,這個名叫ToolFormer的新AI,可以教自己使用計算機、數(shù)據(jù)庫和搜索引擎,來改善它生成的結(jié)果。

3ee3bc6a-ab49-11ed-bfe3-dac502259ad0.png

甚至還有人已經(jīng)搬出了OpenAI CEO那句“AGI可能比任何人預(yù)料的更早來敲響我們的大門”。

3efae5f2-ab49-11ed-bfe3-dac502259ad0.png

但先等等,AI真的就能通過這兩個測試,表明自己具備“心智理論”了嗎?

會不會是“裝出來的”?

例如,中國科學(xué)院計算技術(shù)研究所研究員劉群看過研究后就認(rèn)為:

AI應(yīng)該只是學(xué)得像有心智了。

3f08488c-ab49-11ed-bfe3-dac502259ad0.png

既然如此,GPT-3.5是如何回答出這一系列問題的?

對此,有網(wǎng)友給出了自己的猜測:

這些LLM并沒有產(chǎn)生任何意識。它們只是在預(yù)測一個嵌入的語義空間,而這些語義空間是建立在實際有意識的人的輸出之上的。

3f2b79ba-ab49-11ed-bfe3-dac502259ad0.png

事實上,作者本人同樣在論文中給出了自己的猜測。

如今,大語言模型變得越來越復(fù)雜,也越來越擅長生成和解讀人類的語言,它逐漸產(chǎn)生了像心智理論一樣的能力。

但這并不意味著,GPT-3.5這樣的模型就真正具備了心智理論。

與之相反,它即使不被設(shè)計到AI系統(tǒng)中,也可以作為“副產(chǎn)品”通過訓(xùn)練得到。

因此,相比探究GPT-3.5是不是真的有了心智還是像有心智,更需要反思的是這些測試本身——

最好重新檢查一下心智理論測試的有效性,以及心理學(xué)家們這數(shù)十年來依據(jù)這些測試得出的結(jié)論:

如果AI都能在沒有心智理論的情況下完成這些任務(wù),如何人類不能像它們一樣?

屬實是用AI測試的結(jié)論,反向批判心理學(xué)學(xué)術(shù)圈了(doge)。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39908

    瀏覽量

    301538
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3757

    瀏覽量

    52130
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1598

    瀏覽量

    10297

原文標(biāo)題:ChatGPT背后模型被證實具有人類心智!斯坦福新研究炸了,知名學(xué)者:“這一天終于來了”

文章出處:【微信號:All_best_xiaolong,微信公眾號:大魚機器人】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    巨頭競逐AI醫(yī)療健康:OpenAI推出ChatGPT Health,螞蟻阿福國內(nèi)領(lǐng)跑

    健康已成為AI技術(shù)的高頻應(yīng)用場景。OpenAI在其一篇博客文章中透露,通過分析匿名化的ChatGPT對話數(shù)據(jù),發(fā)現(xiàn)全球每周有超過2.3億人在ChatGPT上咨詢健康相關(guān)問題,醫(yī)療健康的需求極為旺盛。
    的頭像 發(fā)表于 01-10 11:17 ?2427次閱讀

    中汽中心智能網(wǎng)聯(lián)科技創(chuàng)新基地建設(shè)項目正式開工

    李春在致辭中表示,中汽中心智能網(wǎng)聯(lián)科技創(chuàng)新基地落地東麗,是政企雙方深度合作的重要成果,對加快推動區(qū)域產(chǎn)業(yè)轉(zhuǎn)型升級、打造創(chuàng)新發(fā)展新引擎具有關(guān)鍵作用。期待雙方繼續(xù)攜手并進,共同推動?xùn)|麗區(qū)汽車產(chǎn)業(yè)實現(xiàn)跨越式發(fā)展。
    的頭像 發(fā)表于 10-28 10:47 ?711次閱讀

    WIN10配置Hbird-SDK環(huán)境變量

    setup.bat和echo %PATH% ,正常,where這句話,運行之后,很奇怪 解決方法: 找到Hbird SDK的目錄下的setup.bat,修改第二行的NUCLEI_TOOL_ROOT為自己的實際位置(原來是C:nuclei-tools) 運行where這句話,結(jié)果正常,如下
    發(fā)表于 10-27 06:38

    為什么電腦插了UPS,斷電瞬間依然會重啟?真相原來是這樣!

    突如其來的停電,屏幕一黑,主機重啟,未保存的文件瞬間消失……這驚悚的一幕,相信不少人都經(jīng)歷過。更讓人困惑的是:明明已經(jīng)給電腦配備了UPS(不間斷電源),為什么它還是沒能“保住”電腦?今天,我們就來徹底揭開這個謎團。一、核心誤區(qū):UPS≠絕對“零秒切換”許多用戶有一個誤解:認(rèn)為只要插著UPS,斷電時電腦就能毫發(fā)無傷。事實上,能否實現(xiàn)無縫切換,取決于您使用的UP
    的頭像 發(fā)表于 10-20 10:08 ?941次閱讀
    為什么電腦插了UPS,斷電瞬間依然會重啟?真相<b class='flag-5'>原來是</b>這樣!

    Sora2五天下載量破百萬!超越ChatGPT增長速度,App Store免費榜霸榜第一

    ChatGPT用戶增長速度還要快的APP,它來了!但……還是OpenAI它一家的,還是咱們的老熟人Sora2。五天下載量破百萬次,同時輕松拿下AppStore免費榜第一。好好好,現(xiàn)在OpenAI
    的頭像 發(fā)表于 10-13 16:39 ?1697次閱讀
    Sora2五天下載量破百萬!超越<b class='flag-5'>ChatGPT</b>增長速度,App Store免費榜霸榜第一

    中汽中心智能網(wǎng)聯(lián)科技創(chuàng)新基地落戶天津

    2025年9月12日,由中汽智能科技(天津)有限公司(以下簡稱“中汽智能科技”)主辦的“2025年智能網(wǎng)聯(lián)汽車技術(shù)發(fā)展論壇暨中汽中心智能網(wǎng)聯(lián)科技創(chuàng)新基地啟動儀式”(以下簡稱“論壇”)在天津成功舉辦。
    的頭像 發(fā)表于 09-15 10:17 ?727次閱讀

    MDD8205那么小又那么大,原來是這顆MOS

    在智能家電與電動工具快速迭代的今天,高效能與小型化已成為產(chǎn)品設(shè)計的核心需求。MOSFET作為現(xiàn)代電子系統(tǒng)的核心功率開關(guān)器件,廣泛應(yīng)用于電源管理、電機驅(qū)動、信號切換等領(lǐng)域。其性能直接影響系統(tǒng)的效率、功耗和可靠性。隨著便攜式設(shè)備、智能家居和工業(yè)自動化對功率密度和能效的要求越來越高,工程師需要更高性能的MOSFET解決方案。 一、 雙N溝道,為高效而生 MDD8205 是一款20V雙 N溝道MOS,采用SOT-23-6L封裝,在20V耐壓下實現(xiàn)極低導(dǎo)通電阻(RDS(
    的頭像 發(fā)表于 07-28 15:07 ?531次閱讀
    MDD8205那么小又那么大,<b class='flag-5'>原來是</b>這顆MOS

    AI搜索一夜變天,專為Agent做搜索的賽道能否誕生百億美金新巨頭?

    。微軟這一波斷供,可真是要急死開發(fā)者們啊。 但為啥突然斷供? 原來是 看好AI搜索 ,想要和Azure服務(wù)深入綁定,提
    的頭像 發(fā)表于 07-24 13:59 ?675次閱讀
    AI搜索一夜變天,專為Agent做搜索的賽道能否誕生百億美金新巨頭?

    ChatGPT 智能體發(fā)布的觀點解析及對科義相關(guān)系統(tǒng)的現(xiàn)實意義

    7月18日凌晨,OpenAI 發(fā)布通用人工智能代理 ChatGPT 智能體。這一事件蘊含著多層面的深刻意義,同時也為科義巡檢機器人和科義視頻行為分析系統(tǒng)帶來了諸多現(xiàn)實影響。 從技術(shù)層面來看,這標(biāo)志著
    的頭像 發(fā)表于 07-18 16:31 ?1.3w次閱讀

    AI真會人格分裂!OpenAI最新發(fā)現(xiàn),ChatGPT善惡開關(guān)已開啟

    AI現(xiàn)在就像一個小朋友,很容易就學(xué)壞了!OpenAI剛剛發(fā)現(xiàn),如果用錯誤的數(shù)據(jù)微調(diào)自家的模型的一個領(lǐng)域,ChatGPT就會把在這個領(lǐng)域?qū)W到的「惡」和「壞」泛化到其他領(lǐng)域。比如「刻意」用錯誤數(shù)據(jù)在汽車
    的頭像 發(fā)表于 06-20 12:41 ?1.5w次閱讀
    AI真會人格分裂!OpenAI最新發(fā)現(xiàn),<b class='flag-5'>ChatGPT</b>善惡開關(guān)已開啟

    為什么你的電動獸耳經(jīng)??D?原來是這個地方出了問題

    電動獸耳大概分為耳朵、發(fā)箍、舵機、電池包、主控系統(tǒng)5個部分。主要是感應(yīng)式獸耳和機械式獸耳卡頓原因多與舵機故障有關(guān),包括齒輪損壞、電位器失靈、電機堵轉(zhuǎn)或電路短路等。這些故障會導(dǎo)致獸耳運
    的頭像 發(fā)表于 06-09 17:08 ?926次閱讀
    為什么你的電動獸耳經(jīng)常卡頓?<b class='flag-5'>原來是</b>這個地方出了問題

    樹莓派與EthernetHat:用ChatGPT實現(xiàn)的MQTT智能家居項目!

    我們使用Pico、WIZnetW5100S和PicoBricks開發(fā)板開發(fā)了MQTTRGB燈,通過ChatGPT4.0生成和優(yōu)化代碼。項目所需組件硬件組件PicoBricks擴展板x1WIZnetW5100S-EVB-Picox1WIZnetW5500-EVB-PicoWIZnet以太網(wǎng)HATx1樹莓派Picox1
    的頭像 發(fā)表于 06-03 15:29 ?1.5w次閱讀
    樹莓派與EthernetHat:用<b class='flag-5'>ChatGPT</b>實現(xiàn)的MQTT智能家居項目!

    樹莓派遇上ChatGPT,魔法熱線就此誕生!

    盡管這種電話在幾十年前就已過時,但許多人都對旋轉(zhuǎn)撥號電話記憶猶新。這些舊電話,其實可以被改造成一個ChatGPT熱線。這個由PolluxLabs開發(fā)的項目,讓你可以將一部復(fù)古的旋轉(zhuǎn)撥號電話連接到樹莓
    的頭像 發(fā)表于 04-13 09:04 ?1.6w次閱讀
    樹莓派遇上<b class='flag-5'>ChatGPT</b>,魔法熱線就此誕生!

    和安信可Ai-M61模組對話?手搓一個ChatGPT 語音助手 #人工智能 #

    ChatGPT
    jf_31745078
    發(fā)布于 :2025年03月12日 15:56:59

    能和Ai-M61模組對話了?手搓一個ChatGPT 語音助手

    起猛了, 安信可的Ai-M61模組能說話了! 超低延遲實時秒回 ,對話超絲滑的那種,先來看一段VCR: 小安派+ChatGPT語音實測:對話絲滑到忘記對面是AI_ 人工智能的應(yīng)用日益廣泛。 各家模型
    的頭像 發(fā)表于 03-12 11:57 ?1.2w次閱讀
    能和Ai-M61模組對話了?手搓一個<b class='flag-5'>ChatGPT</b> 語音助手