91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepMind給AI測(cè)IQ,結(jié)果出人意料!

jmiy_worldofai ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-07-24 16:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

活在一個(gè)AI“泛濫”的時(shí)代,我們幾乎每天都能看到 AI 研究上的最新進(jìn)展。昨天,AI 打 DoTA 戰(zhàn)勝人類了;今天,AI 能自己找路了;明天,AI 能假冒人類打電話了。在擔(dān)心 AI 會(huì)滅掉人類的人們眼中,AI 正像一只怪物一樣野蠻生長(zhǎng),像一只侵略軍一樣從遠(yuǎn)方大跨步逼近。

然而實(shí)際上,你所看到的這些進(jìn)展,只是不同的 AI 在特定方向的進(jìn)步。雖然當(dāng)前基于深度學(xué)習(xí)的 AI 熱潮已經(jīng)有五六年了,還是沒(méi)有一個(gè)獨(dú)立的 AI,像一個(gè)獨(dú)立的人一樣,能夠優(yōu)秀地執(zhí)行多種任務(wù)。

人們?cè)谛稳?AI 時(shí),通常會(huì)用這樣一種說(shuō)法:這個(gè) AI 的智商,跟三歲小孩差不多。 智商 (Intelligence quotient) 簡(jiǎn)稱 IQ,是評(píng)價(jià)人類智商一個(gè)普遍接受的標(biāo)準(zhǔn) 。你有智商,我也有智商,就連三歲小孩也有智商。接下來(lái)問(wèn)題來(lái)了:既然說(shuō) AI 跟三歲小孩差不多,那么它的智商到底有多少呢

得給 AI 測(cè)測(cè)智商了。

DeepMind要給AI測(cè)IQ

自 AlphaGo 橫空出世以來(lái),AI 在解決一些復(fù)雜的、策略性的問(wèn)題上,能力已經(jīng)得到了證明。但如果想要更像“人”,AI 必須也擁有像人類一樣的抽象理解能力。

現(xiàn)在的 AI 計(jì)算能力不用說(shuō)了,推理能力也很強(qiáng),所以只剩抽象理解能力了。Google 旗下的 AI 科研機(jī)構(gòu) DeepMind 認(rèn)為,“基于神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)模型取得了驚人的成績(jī),但想要衡量其推理抽象概念的能力,卻非常困難?!?/p>

為了搞清楚現(xiàn)在的 AI 在抽象理解能力上究竟實(shí)力如何,DeepMind 還真給 AI 設(shè)計(jì)了一套測(cè)試題:

這套測(cè)試題,借鑒了人類的 IQ 測(cè)試?yán)镏娜鹞耐评頊y(cè)驗(yàn):給定一組圖片,找到符合其“演進(jìn)”規(guī)律的圖片。

(圖片來(lái)源:DeepMind 論文)

在這種測(cè)試中,題目里并不會(huì)告訴你要找到符合什么標(biāo)準(zhǔn)的圖形,而是需要我們根據(jù)日常生活中學(xué)習(xí)或掌握到的一些基本原則,來(lái)理解和分析測(cè)試中出現(xiàn)的簡(jiǎn)單圖案。

要找到正確的答案,往往要借鑒我們從生活中明白的“演進(jìn)”規(guī)律。比如小樹(shù)苗長(zhǎng)成大樹(shù),比如從 0 到1、2、3、4、5 的加法,再比如加減乘除。以上這些,就是我們生活中所提煉出的抽象的“演進(jìn)”(progression)的意義,就是人類的抽象理解能力。

“但是,我們現(xiàn)在還沒(méi)有找到辦法,能讓 AI 也可以從 ‘日常經(jīng)驗(yàn)’中學(xué)到類似的能力?!?DeepMind 在論文中說(shuō)。

“不過(guò),我們依然可以很好地利用人類的這種視覺(jué)抽象邏輯測(cè)試,來(lái)設(shè)計(jì)一個(gè)實(shí)驗(yàn)。在這個(gè)測(cè)試中,我們并不是像人類測(cè)試那樣,考察從日常生活到視覺(jué)推理問(wèn)題的知識(shí)轉(zhuǎn)移。而是研究AI在將知識(shí)從一組受控的視覺(jué)推理問(wèn)題,轉(zhuǎn)移到另一組問(wèn)題的能力?!?/p>

簡(jiǎn)單翻譯一下這段話就是:DeepMind 先給 AI 喂一組由三角形構(gòu)成的圖像的視覺(jué)推理題庫(kù),等訓(xùn)練的差不多了,再出一組由方塊構(gòu)成的視覺(jué)推理題,讓 AI 去回答,看它是能隨機(jī)應(yīng)變舉一反三,還是學(xué)會(huì)了三角,換成方塊就不靈了。

機(jī)器人仍需努力

對(duì)于擔(dān)心 AI 取代人類的朋友來(lái)說(shuō),DeepMind 的一部分實(shí)驗(yàn)結(jié)果確實(shí)是個(gè)好消息:一些最棒的 AI 模型,在這個(gè)IQ測(cè)試中的表現(xiàn)得并不咋樣。

正如預(yù)期的那樣,當(dāng)訓(xùn)練集和測(cè)試集所采用的抽象元素相同時(shí),多個(gè) AI 模型都表現(xiàn)出超過(guò)75%的準(zhǔn)確率。

然而,當(dāng)測(cè)試集和訓(xùn)練集出現(xiàn)變化,甚至有時(shí)候只是把黑點(diǎn)換成較暗的淺色圓點(diǎn),AI 的表現(xiàn)就會(huì)像無(wú)頭蒼蠅一樣,失去了準(zhǔn)星。

(一些知名AI模型的表現(xiàn) 圖片來(lái)源:DeepMind 論文)

上面這些都是深度神經(jīng)網(wǎng)絡(luò)領(lǐng)域的當(dāng)紅炸子雞,測(cè)起智商來(lái)卻沒(méi)那么靈光了。

ResNet (Deep Residual Network),即深度殘差網(wǎng)絡(luò)在其中一組測(cè)試中僅僅得到22.4%的低分。 要知道,它的提出曾被形容為CNN(卷積神經(jīng)網(wǎng)絡(luò))的一個(gè)里程碑式事件,它在網(wǎng)絡(luò)深度上比其他模型提升了n個(gè)量級(jí),更重要的是它的殘差學(xué)習(xí)方式,改良了模型的架構(gòu),因此一出現(xiàn)就秒殺眾前輩。

測(cè)試中表現(xiàn)最好的 WReN 模型,則是 DeepMind 在關(guān)系網(wǎng)絡(luò) (Relation Networks) 模型基礎(chǔ)上改良的版本。它增加了對(duì)不同圖像組合之間關(guān)系的分析,并可以對(duì)這類 IQ 測(cè)試的各種可能性結(jié)果進(jìn)行評(píng)估。

不過(guò),DeepMind 針對(duì)這個(gè)測(cè)試的邏輯,對(duì)一些模型進(jìn)行改良,改良后的模型表現(xiàn)出明顯的提升。

比如,在一些模型中,DeepMind 加入了元標(biāo)記(meta-targets) 的輔助訓(xùn)練方法,讓模型對(duì)數(shù)據(jù)集背后體現(xiàn)出的形狀、屬性(形狀的數(shù)量、大小、顏色深淺等)以及關(guān)系(同時(shí)出現(xiàn)、遞減、遞增等等)進(jìn)行預(yù)測(cè),當(dāng)這部分預(yù)測(cè)準(zhǔn)確時(shí),最終回答的準(zhǔn)確率就明顯出現(xiàn)提升,預(yù)測(cè)錯(cuò)誤時(shí),回答準(zhǔn)確率明顯下降。一些極端情況下,模型回答的準(zhǔn)確率更是從預(yù)測(cè)錯(cuò)誤時(shí)的32%提升至了87%。

(元標(biāo)記預(yù)測(cè)準(zhǔn)確度與最終答案準(zhǔn)確率的關(guān)系圖)

DeepMind 表示,他們?cè)O(shè)計(jì)的這個(gè)實(shí)驗(yàn),最終目的并不是為了讓 AI 能夠通過(guò)這種 IQ 測(cè)試。他們關(guān)注的是 AI 泛化能力的問(wèn)題。

泛化是指模型很好地?cái)M合以前未見(jiàn)過(guò)的新數(shù)據(jù)的能力,這是機(jī)器學(xué)習(xí)界的術(shù)語(yǔ),你也可以粗暴的理解成一個(gè) AI 模型能否在各類場(chǎng)景中“通吃”。AI 的泛化能力越強(qiáng),離啥都能干的所謂“通用人工智能”就越近。

DeepMind 在博客最后這樣說(shuō)道:

研究表明,尋找關(guān)于泛化問(wèn)題的普遍結(jié)論可能沒(méi)有任何意義。我們測(cè)試的神經(jīng)網(wǎng)絡(luò)在某些泛化方案中表現(xiàn)優(yōu)秀,但是其他方案下卻很糟糕。

諸如所使用模型的架構(gòu)、模型是否被訓(xùn)練從而能解釋答案背后的邏輯等一系列因素,都會(huì)對(duì)泛化效果帶來(lái)影響。而在大多數(shù)情況下,當(dāng)需要處理過(guò)往經(jīng)驗(yàn)從未涉及的、或完全陌生的情景時(shí),這些 AI 的表現(xiàn)很糟糕。

至少現(xiàn)在看來(lái),AI 還有很長(zhǎng)的路要走啊。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39944

    瀏覽量

    301572
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    131

    瀏覽量

    12308

原文標(biāo)題:DeepMind給最厲害的AI測(cè)了IQ,結(jié)果讓人輕松了不少!

文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI 驅(qū)動(dòng)的電力電子拓?fù)浼癝iC器件選型自動(dòng)優(yōu)化:跳出人類經(jīng)驗(yàn)的“最優(yōu)解”

    AI 驅(qū)動(dòng)的電力電子拓?fù)浼癝iC器件選型自動(dòng)優(yōu)化:跳出人類經(jīng)驗(yàn)的“最優(yōu)解” 緒論:人工智能重塑電力電子設(shè)計(jì)范式 隨著生成式人工智能(Generative AI)、大型語(yǔ)言模型(LLMs)以及高性能
    的頭像 發(fā)表于 03-10 20:13 ?20次閱讀

    使用NORDIC AI的好處

    Nordic 的 Edge AI 主要有以下幾個(gè)好處(基于官方資料總結(jié)): 極低功耗、延長(zhǎng)電池壽命 在本地運(yùn)行 AI,減少無(wú)線傳輸次數(shù),而無(wú)線收發(fā)是最耗電的部分。設(shè)備只需上傳“結(jié)果/事件”,而不是
    發(fā)表于 01-31 23:16

    純4G?血版AI小智產(chǎn)品方案 #小智AI #AI方案商 #4G通話 #AI終端產(chǎn)品

    AI
    不太正經(jīng)的攻城獅
    發(fā)布于 :2025年12月21日 14:36:55

    VS680 HDMI AI分析解決方案 #目標(biāo)識(shí)別 #視頻翻譯 #AI #芯片

    AI
    深蕾半導(dǎo)體
    發(fā)布于 :2025年11月12日 10:29:33

    【飛凌OK-MX9596-C開(kāi)發(fā)板試用】③云端AI拍照識(shí)別

    版) 創(chuàng)建成功后,會(huì)得到 API Key和Secret Key 這兩項(xiàng)很重要 在示例代碼中心,我們可以選擇用上述獲得的 API Key和Secret Key,測(cè)試AI運(yùn)行結(jié)果。 上傳一個(gè)圖片,點(diǎn)擊:發(fā)起
    發(fā)表于 11-01 22:12

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個(gè)AI模型怎么搞,知識(shí)盲區(qū)
    發(fā)表于 10-14 07:14

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    AI被賦予了人的智能,科學(xué)家們希望在沒(méi)有人類的引導(dǎo)下,AI自主的提出科學(xué)假設(shè),諾貝爾獎(jiǎng)級(jí)別的假設(shè)哦。 AI驅(qū)動(dòng)科學(xué)被認(rèn)為是科學(xué)發(fā)現(xiàn)的第五個(gè)范式了,與實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)、數(shù)據(jù)驅(qū)動(dòng)科學(xué)一起構(gòu)成
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的未來(lái):提升算力還是智力

    本章節(jié)作者分析了下AI的未來(lái)在哪里,就目前而言有來(lái)那個(gè)兩種思想:①繼續(xù)增加大模型②將大模型改為小模型,并將之優(yōu)化使之與大模型性能不不相上下。 一、大模型是一條不可持續(xù)發(fā)展的道路 大模型的不可
    發(fā)表于 09-14 14:04

    IQ混頻器為何能抑制鏡像頻率

    IQ混頻器是一種基于正交架構(gòu)的混頻器,通過(guò)將輸入信號(hào)分解為同相(I)和正交(Q)兩路信號(hào),并分別進(jìn)行混頻運(yùn)算,實(shí)現(xiàn)復(fù)雜信號(hào)的調(diào)制、解調(diào)及鏡像頻率抑制等功能。因?yàn)?IQ 混頻器同時(shí)產(chǎn)生兩路正交(90
    發(fā)表于 09-08 09:43

    什么是 DC-DC 開(kāi)關(guān)穩(wěn)壓器的靜態(tài)電流 IQ?

    什么是 DC-DC 開(kāi)關(guān)穩(wěn)壓器的靜態(tài)電流 IQ?
    發(fā)表于 09-08 07:02

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實(shí)現(xiàn)。 而大腦是一個(gè)由無(wú)數(shù)神經(jīng)元通過(guò)突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)上就是一臺(tái)濕潤(rùn)的軟組織
    發(fā)表于 09-06 19:12

    RFMD2081 選型指南 低功耗、寬帶 IQ 調(diào)制器

    選型指南,一篇文章帶你了解,RFMD2081 低功耗、寬帶 IQ 調(diào)制器
    的頭像 發(fā)表于 08-12 16:43 ?4722次閱讀
    RFMD2081 選型指南 低功耗、寬帶 <b class='flag-5'>IQ</b> 調(diào)制器

    關(guān)于NanoEdge AI用于n-Class的問(wèn)題求解

    ,但把模型的靜態(tài)庫(kù)加到Keil5的工程中編譯后運(yùn)行在STM32F407G-DISC1的開(kāi)發(fā)板上仿真測(cè)試時(shí),我輸入的數(shù)據(jù)不管怎么變,AI模型輸出的結(jié)果永遠(yuǎn)是第1個(gè)分類(非unknown),不能正常對(duì)數(shù)
    發(fā)表于 08-11 06:44

    利用自壓縮實(shí)現(xiàn)大型語(yǔ)言模型高效縮減

    隨著語(yǔ)言模型規(guī)模日益龐大,設(shè)備端推理變得越來(lái)越緩慢且耗能巨大。一個(gè)直接且效果出人意料的解決方案是剪除那些對(duì)任務(wù)貢獻(xiàn)甚微的完整通道(channel)。我們?cè)缙诘难芯刻岢隽艘环N訓(xùn)練階段的方法——自壓
    的頭像 發(fā)表于 07-28 09:36 ?570次閱讀
    利用自壓縮實(shí)現(xiàn)大型語(yǔ)言模型高效縮減

    AI智能眼鏡存儲(chǔ)帶來(lái)的機(jī)遇與挑戰(zhàn)

    人工智能(AI)逐漸走入人們的日常生活,AI智能眼鏡的問(wèn)世更是引發(fā)了行業(yè)內(nèi)外的強(qiáng)烈關(guān)注。AI智能眼鏡擁有強(qiáng)大的功能和出色的設(shè)計(jì),AI眼鏡能夠?qū)崟r(shí)處理信息、進(jìn)行智能語(yǔ)音識(shí)別,甚至可以通過(guò)
    的頭像 發(fā)表于 03-22 10:16 ?1730次閱讀