91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

心智理論測試:人工智能擊敗人類

AI智勝未來 ? 來源:悅智網(wǎng) ? 2024-11-08 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

測試結(jié)果并不一定意味著人工智能可以“理解”人。

心智理論是指可以理解他人心理狀態(tài)的能力,正是它驅(qū)使著人類社會運(yùn)轉(zhuǎn)。它幫助你決定在緊張的情況下該說什么、猜測其他車輛的駕駛員將要做什么,以及與電影中的角色產(chǎn)生共鳴。一項(xiàng)最新的研究表明,ChatGPT等工具所使用的大語言模型在模仿這一典型人類特征方面表現(xiàn)得非常出色。

“在進(jìn)行這項(xiàng)研究之前,我們都相信大語言模型無法通過這些測試,特別是那些判斷不易察覺的心理狀態(tài)能力的測試?!痹撗芯康暮现呖死锼沟倌?貝奇奧(Cristina Becchio)說,她是德國漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心的認(rèn)知神經(jīng)科學(xué)教授。這項(xiàng)她認(rèn)為“出乎意料和令人驚訝”的研究結(jié)果發(fā)表在2024年5月20日的《自然?人類行為》雜志中。

貝奇奧和她的同事并不是首先提出證據(jù)表明大語言模型的反應(yīng)能夠表現(xiàn)這種推理能力的人。在2023年發(fā)表的一篇預(yù)印本論文中,斯坦福大學(xué)心理學(xué)家邁克爾?科辛斯基(Michal Kosinski)報(bào)告了幾個(gè)模型在幾種常見心智理論測試中的測試情況。他發(fā)現(xiàn),其中最好的是OpenAI的GPT-4,它正確完成了75%的任務(wù),他說,這相當(dāng)于過去研究中6歲兒童的表現(xiàn)。不過,這項(xiàng)研究中的方法遭到了其他研究人員的批評,他們進(jìn)行了后續(xù)實(shí)驗(yàn),并得出結(jié)論,大語言模型之所以能得出正確答案,往往是基于“淺顯的啟發(fā)”和捷徑,而不是真正基于心智理論推理。

本研究的作者很清楚這種爭論。“在論文中,我們的目標(biāo)是使用廣泛的心理測試,以更加系統(tǒng)的方式來應(yīng)對機(jī)器心智理論的評估挑戰(zhàn)。”該研究的合著者詹姆斯?斯特拉坎(James Strachan)說,他是一名認(rèn)知心理學(xué)家,目前是漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心的訪問科學(xué)家。他指出,進(jìn)行嚴(yán)謹(jǐn)?shù)难芯恳馕吨獪y試人類和大語言模型處理相同任務(wù)的能力,這項(xiàng)研究比較了1907個(gè)人與幾個(gè)流行的大語言模型的能力。

大語言模型和人類都完成了5種典型的心智理論測試,前3種是理解暗示、反語和失禮。此外,他們還回答了“錯(cuò)誤信念”問題,這些問題通常用于確定幼兒心智理論的發(fā)展程度。這些問題是這樣的:如果愛麗絲在鮑勃不在房間的時(shí)候移動了某樣?xùn)|西,那么鮑勃回來后應(yīng)該去哪里找這個(gè)東西?最后,他們回答了“奇怪故事”中一些相當(dāng)復(fù)雜的問題,這些故事中的人物相互撒謊、操縱并產(chǎn)生了很多誤解。

總體而言,GPT-4占據(jù)了優(yōu)勢。它的得分在錯(cuò)誤信念測試中與人類相當(dāng),在反語、暗示和奇怪故事方面的總分高于人類,只在失禮測試中表現(xiàn)不如人類。為了理解失禮測試結(jié)果有所不同的原因,研究人員對該模型進(jìn)行了一系列后續(xù)測試,探索了幾種假設(shè)。他們得出的結(jié)論是,GPT-4能夠?qū)τ嘘P(guān)失禮的問題給出正確答案,但在固執(zhí)己見方面受到“極端保守”編程的限制。斯特拉坎指出,OpenAI在模型周圍設(shè)置了許多圍欄,“旨在保持模型真實(shí)、誠實(shí)和正確”,他認(rèn)為,旨在防止GPT-4產(chǎn)生幻覺(即編造內(nèi)容)的策略可能會妨礙它對一些問題輸出觀點(diǎn),比如故事角色是否在高中同學(xué)聚會上無意間侮辱了老同學(xué)。

研究人員很謹(jǐn)慎。他們沒有說自己的研究結(jié)果表明大語言模型實(shí)際上擁有心智理論能力,而是說大語言模型“在心智理論任務(wù)中的表現(xiàn)與人類行為沒有區(qū)別”。這就引出了一個(gè)問題:如果一個(gè)仿品和真品一樣好,那你怎么知道它不是真品?斯特拉坎說,這是一個(gè)社會科學(xué)家以前從未嘗試回答的問題,因?yàn)閷θ祟惖臏y試會假設(shè)這種品質(zhì)在某種程度上是存在的。“我們目前還沒有一種方法甚至是一種理念來測試心智理論的存在,這是一種現(xiàn)象學(xué)品質(zhì)?!彼f。

華盛頓大學(xué)計(jì)算語言學(xué)教授艾米麗?本德(Emily Bender)因堅(jiān)持揭露人工智能行業(yè)的膨脹炒作而成為了該領(lǐng)域的傳奇人物。她對這個(gè)激勵(lì)著研究人員的問題提出了異議?!懊鎸ο嗤瑔栴},文本處理系統(tǒng)能否產(chǎn)生與人類相似的答案為什么如此重要?”她問道,“我們能夠了解大語言模型內(nèi)部是如何運(yùn)作的嗎?它們可能有什么用處,又可能帶來哪些危險(xiǎn)?”

本德對論文中的擬人化表示擔(dān)憂,論文研究人員說大語言模型有認(rèn)知、推理和作出選擇的能力,還使用了“大語言模型和人類參與者之間的物種公平比較”這一措辭。本德說,這“完全沒有將軟件囊括在內(nèi)”。

漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心團(tuán)隊(duì)的研究結(jié)果可能并不表明人工智能真的能理解我們,但值得思考的是,人工智能能夠做出令人信服的行為,這會帶來什么影響。雖然這種大語言模型在與人類用戶交互和預(yù)測用戶需求方面會做得更好,但它們也可能更多地用于欺騙和操縱。它們會引來更多的擬人化,讓人類用戶相信用戶界面的另一端是有思想的。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1818

    文章

    50119

    瀏覽量

    265600

原文標(biāo)題:人工智能在心智理論測試中戰(zhàn)勝人類

文章出處:【微信號:AI智勝未來,微信公眾號:AI智勝未來】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    淺談人工智能(2)

    。 強(qiáng)人工智能(Strong AI),又稱通用人工智能(Artificial General Intelligence)或完全人工智能,指的是可以勝任人類所有工作的
    的頭像 發(fā)表于 02-22 08:24 ?165次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    世界移動通信大會|開啟無線測試人工智能融合的未來篇章

    專為當(dāng)下至關(guān)重要的無線技術(shù)——Wi-Fi 8、6G以及基于開放式無線接入網(wǎng)(Open RAN)的5G基礎(chǔ)設(shè)施——精心打造測試解決方案。這些技術(shù)對于在邊緣計(jì)算場景中實(shí)現(xiàn)人工智能應(yīng)用起著決定性作用。穩(wěn)固可靠的連接性是人工智能驅(qū)動型應(yīng)
    的頭像 發(fā)表于 02-12 14:34 ?542次閱讀

    開發(fā)智能體配置-內(nèi)容合規(guī)

    智能體上架前,需完成“人工智能生成合成內(nèi)容標(biāo)識”和“大模型備案信息”填寫 ,以供平臺審核;可在智能體【配置】-【內(nèi)容合規(guī)】中填寫。 人工智能生成合成內(nèi)容標(biāo)識 “
    發(fā)表于 02-07 11:44

    自然智能與人工智能融合如何重塑芯片設(shè)計(jì)

    人類大腦是所有處理器中最復(fù)雜的,能夠構(gòu)思出不可思議的創(chuàng)意,解決復(fù)雜、微妙的問題。相比之下,人工智能擅長快速分析海量數(shù)據(jù)并高效執(zhí)行任務(wù)。當(dāng)自然智能人工智能融合的結(jié)果,就是芯片設(shè)計(jì)領(lǐng)域正
    的頭像 發(fā)表于 01-15 13:58 ?533次閱讀

    物理人工智能面臨的安全風(fēng)險(xiǎn)

    機(jī)器人,再到常見的掃地機(jī)器人,物理人工智能系統(tǒng)正變得越來越智能,也越來越貼近人類生活。先進(jìn)的3D傳感器、人工智能攝像頭、語音接口
    的頭像 發(fā)表于 11-17 10:54 ?921次閱讀
    物理<b class='flag-5'>人工智能</b>面臨的安全風(fēng)險(xiǎn)

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹這對開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進(jìn)您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    人工智能+”,走老路難賺到新錢

    昨天的“人工智能+”刷屏了,這算是官方第一次對“人工智能+”這個(gè)名稱定性吧?今年年初到現(xiàn)在,涌現(xiàn)出了一大批基于人工智能的創(chuàng)業(yè)者,這已經(jīng)算是AI2.0時(shí)代的第三波創(chuàng)業(yè)潮了,第一波是基礎(chǔ)大模型,第二波
    的頭像 發(fā)表于 08-27 13:21 ?741次閱讀
    “<b class='flag-5'>人工智能</b>+”,走老路難賺到新錢

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學(xué),便捷拉滿 這個(gè)實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學(xué),便捷拉滿 這個(gè)實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:23

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時(shí)代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    生成式人工智能認(rèn)證:重構(gòu)AI時(shí)代的人才培養(yǎng)與職業(yè)躍遷路徑

    當(dāng)人類站在生成式人工智能(Generative AI)的技術(shù)奇點(diǎn)上回望,會發(fā)現(xiàn)這場革命早已超越了工具迭代的范疇——它正在重新定義人類與技術(shù)的協(xié)作模式,重塑職業(yè)世界的運(yùn)行邏輯。生成式人工智能
    的頭像 發(fā)表于 05-23 09:29 ?868次閱讀

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴(kuò)展/重力感應(yīng)/RS232/RS485/IO 擴(kuò)展/I2C 擴(kuò)展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個(gè)全新八核擁有超強(qiáng)性能的人工智能
    發(fā)表于 04-23 10:55

    迅為iTOP-RK3576人工智能開發(fā)板Android?系統(tǒng)接口功能測試

    迅為iTOP-RK3576人工智能開發(fā)板Android?系統(tǒng)接口功能測試
    的頭像 發(fā)表于 03-28 14:45 ?3812次閱讀
    迅為iTOP-RK3576<b class='flag-5'>人工智能</b>開發(fā)板Android?系統(tǒng)接口功能<b class='flag-5'>測試</b>