91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPT-3通過了大部分課程的寫作測試

深度學(xué)習(xí)自然語言處理 ? 來源:機(jī)器之心 ? 作者:機(jī)器之心 ? 2021-03-05 15:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

GPT-3 寫的論文及格了嗎?教育資源網(wǎng)站 EduRef 對此進(jìn)行了一項(xiàng)測試,效果還行,及格水平。

2020 年 5 月,OpenAI 推出了具有 1750 億參數(shù)的史上最大 AI 模型 GPT-3,該模型不僅可以更好地答題、翻譯、寫文章,還帶有一些數(shù)學(xué)計算的能力。自推出以來,該模型就開始在不同的領(lǐng)域大顯身手,如基于問題的搜索引擎、與歷史人物對話、基于文本描述生成代碼以及繪圖和圖像補(bǔ)全等等。

但 GPT-3 的應(yīng)用之路遠(yuǎn)未結(jié)束…

近日,教育資源網(wǎng)站 EduRef 進(jìn)行了一項(xiàng)測試,他們找了一組教授創(chuàng)建了一個寫作提示,然后讓應(yīng)屆畢業(yè)生和本科生以及 GPT-3 同時根據(jù)該提示寫作,最后教授組對匿名提交的作文打分,并對作者進(jìn)行追蹤調(diào)查。那么,究竟結(jié)果如何呢?GPT-3 的分?jǐn)?shù)能夠超過人類作者嗎?未必!

GPT-3 通過了大部分課程的寫作測試

常言道:「評級為 C 就可以畢業(yè)(C’s get degrees)」。AI 遠(yuǎn)遠(yuǎn)達(dá)不到完美,GPT-3 的寫作水平大概相當(dāng)于自由寫作者(freelance writer)。

結(jié)果顯示,在 COVID-19 疫苗效力的研究方法論文寫作上,人類作者可以得到 B 或者 D,而 GPT-3 往往只能得到 C。在美國歷史類的測試中,人類作者可以在美國例外主義論文中得到 B 或者 C+,而 GPT-3 只能得到 B-。最后,在法學(xué)課上的政策函寫作中,GPT-3 得到了 B-,而 3 個學(xué)生中只有 1 個能夠得到高分。

下圖為人類作者與 GPT-3 在不同學(xué)科寫作中的得分情況:

由此可見,GPT-3 的寫作技能主要體現(xiàn)在技術(shù)類文檔中。在創(chuàng)意寫作課程中的地點(diǎn)記敘文(place narrative)寫作中,GPT-3 僅得到了 F,沒有通過測試。作為對比,自由寫作者得到了 A、B + 和 D+。盡管在創(chuàng)意寫作教授的眼中,GPT-3 失敗了,但自然語言生成(NLG)軟件依然可以用于編寫各類內(nèi)容,包括一部幾乎獲獎的小說《The Day a Computer Writes a Novel》。先前的成功也預(yù)示著以后的失敗,GPT-3 或許只需要一些調(diào)整即可以成為一名合格的創(chuàng)意作家??偟膩碚f,AI 幾乎通過了所有的課程寫作測試。

GPT-3 20 分鐘完成論文

雖然每個教授打分都不一樣,但該評分小組包括兩名博士和一名醫(yī)學(xué)碩士。他們總共有超過 55 年的高中和各種大學(xué)水平的教學(xué)經(jīng)驗(yàn)。寫作者包括應(yīng)屆畢業(yè)生和本科生,其中一些人在他們的研究領(lǐng)域?qū)懥颂崾尽F骄鶃碚f,他們需要 3 天時間完成任務(wù)。

對于絕大多數(shù)學(xué)生來說,3 天內(nèi)完成大學(xué)論文似乎是很難的事情,主要原因在于時間太短,但是 GPT-3 在 20 分鐘內(nèi)就完成了這個任務(wù)。GPT-3 利用深度學(xué)習(xí)產(chǎn)生類似人類的文本,每項(xiàng)任務(wù)花費(fèi) 3 到 20 分鐘完成,并且用最長的時間來編寫創(chuàng)造性的寫作敘述。為了避免人為干擾,GPT-3 只對輸出長度和重復(fù)文本進(jìn)行了輕微的編輯,其生成的內(nèi)容、真實(shí)信息和語法都沒有受到影響。

GPT-3 生成的美國歷史類作文示例如下:

GPT-3 可生成類似人類寫作的內(nèi)容

即使沒有人為干擾,GPT-3 的任務(wù)也或多或少地收到了與人類作者相同的反饋。49.2% 的評論涉及語法和句法,26.2% 的評論涉及重點(diǎn)和細(xì)節(jié),語氣與行文結(jié)構(gòu)等也被提及,但分別只有 12.3% 和 10.8%。這與人類作家收到的評論比例幾乎相同,近 50% 的評論與語法和句法有關(guān),25.4% 的評論與焦點(diǎn)和細(xì)節(jié)有關(guān)。超過 13% 的評論是關(guān)于人類專業(yè)知識,而 10.4% 的評論是關(guān)于整體風(fēng)格等。

人類作者與 GPT-3 的寫作結(jié)果收到的評論反饋情況:

盡管收到了同樣風(fēng)格的評論,GPT-3 生成的內(nèi)容與人類作者并不那么相似。以排名靠前的兩個單詞組合為例,GPT-3 和人類作者只分享了排名靠前的組合:「of the」?!窹eople who」、「it is」和「those who」常被 GPT-3 使用,而人類作者經(jīng)常使用的是「to the」、「in the」和「on the」??傮w來說,這些單詞是在英語中經(jīng)常使用的,組合上的差異顯示出 AI 和人類在寫作結(jié)構(gòu)上的一些差異。

人類作者與 GPT-3 在寫作用詞上的差異分析:

考慮到 GPT-3 超高的論文得分,搭配統(tǒng)計數(shù)據(jù)的差異表明,人類作者比 AI 產(chǎn)生的獨(dú)特內(nèi)容明顯更多。

盡管 GPT-3 具有出色的產(chǎn)出,但其生成的論文在短期內(nèi)還無法獨(dú)立獲得大學(xué)學(xué)位。當(dāng)與人類作者競爭時,GPT-3 獲得了一些及格分?jǐn)?shù),但在創(chuàng)意寫作方面有所欠缺。盡管它在眾多領(lǐng)域的成功為 AI 的未來帶來了希望,但對大學(xué)教授來說,AI 依然存在不足。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39903

    瀏覽量

    301538
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3757

    瀏覽量

    52129

原文標(biāo)題:【GPT-3】除了缺少點(diǎn)創(chuàng)意,GPT-3寫出了及格的大學(xué)畢業(yè)論文,只需20分鐘

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    火焰等離子設(shè)備賦能固態(tài)電池攻破界面難題

    近日,中國一汽宣布紅旗全固態(tài)電池首臺樣車成功下線,其電芯通過了嚴(yán)苛的200℃熱濫用測試。
    的頭像 發(fā)表于 03-09 17:25 ?752次閱讀

    剛剛,安世中國發(fā)布致客戶公告函!大部分業(yè)務(wù)已恢復(fù)運(yùn)行

    辦公環(huán)境無法正常訪問,對安世中國區(qū)運(yùn)營造成較大影響。 ? 受此影響,部分生產(chǎn)流程,如“客供晶圓到廠后的SAP下單轉(zhuǎn)生產(chǎn)”環(huán)節(jié)出現(xiàn)中斷,已在SAP中開單并進(jìn)入生產(chǎn)流程的訂單則未受影響。目前,中國區(qū)IT與業(yè)務(wù)部門已協(xié)同啟動應(yīng)急預(yù)案,優(yōu)先恢復(fù)關(guān)鍵系統(tǒng)與生產(chǎn)調(diào)度。 ? 當(dāng)前,大部分
    的頭像 發(fā)表于 03-06 14:45 ?1705次閱讀
    剛剛,安世中國發(fā)布致客戶公告函!<b class='flag-5'>大部分</b>業(yè)務(wù)已恢復(fù)運(yùn)行

    2026年度《PCB板電磁兼容設(shè)計與評審方法》課程來襲!

    課程名稱:《PCB電磁兼容設(shè)計與評審方法》講師:石老師時間地點(diǎn):上海10月23-24日主辦單位:賽盛技術(shù)課程背景PCB板是電子產(chǎn)品的噪聲源,也是電子產(chǎn)品的敏感源,可以說一個好的PCB板可以解決大部分
    的頭像 發(fā)表于 01-07 16:42 ?448次閱讀
    2026年度《PCB板電磁兼容設(shè)計與評審方法》<b class='flag-5'>課程</b>來襲!

    GPT-5.1發(fā)布 OpenAI開始拼情商

    OpenAI正式上線了 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型;有網(wǎng)友實(shí)測發(fā)現(xiàn)OpenAI新發(fā)布的GPT-5.1大模型的指令執(zhí)行能力更強(qiáng)了,可以更可靠地回答用戶
    的頭像 發(fā)表于 11-13 15:49 ?711次閱讀

    華科智源半導(dǎo)體分立器件測試

    半導(dǎo)體分立器件測試儀產(chǎn)品介紹產(chǎn)品為桌面放置的臺式機(jī)結(jié)構(gòu),由測試主機(jī)和程控電腦兩大部分組成。外掛各類夾具和適配器,還能夠通過Prober接口、Handler接口可選(16Bin)連接分選
    的頭像 發(fā)表于 10-29 10:28 ?500次閱讀
    華科智源半導(dǎo)體分立器件<b class='flag-5'>測試</b>儀

    e203乘法器的優(yōu)化分享

    計算通路計算出結(jié)果。 測試通過了coremark跑分驗(yàn)證 可以看到性能有了比較大的提升 ,從原來的2.1 到了 3.08
    發(fā)表于 10-24 10:41

    上海 11月2日-3日《電路測試技術(shù)與測試實(shí)例及案例分析》公開課即將開始!

    課程名稱:《電路測試技術(shù)與測試實(shí)例及案例分析》講師:王老師時間地點(diǎn):上海11月2日-3日主辦單位:賽盛技術(shù)課程背景Randy基于十多年深厚的
    的頭像 發(fā)表于 09-12 10:23 ?545次閱讀
    上海 11月2日-<b class='flag-5'>3</b>日《電路<b class='flag-5'>測試</b>技術(shù)與<b class='flag-5'>測試</b>實(shí)例及案例分析》公開課即將開始!

    電能質(zhì)量在線監(jiān)測裝置通過了CQC認(rèn)證意味著什么?

    LZ-100電能質(zhì)量在線監(jiān)測裝置 電能質(zhì)量在線監(jiān)測裝置通過CQC 認(rèn)證(中國質(zhì)量認(rèn)證中心認(rèn)證),意味著該裝置在合規(guī)性、技術(shù)性能、安全性、可靠性等核心維度,均符合國家 / 行業(yè)相關(guān)標(biāo)準(zhǔn)及 CQC 認(rèn)證
    的頭像 發(fā)表于 09-03 15:57 ?800次閱讀
    電能質(zhì)量在線監(jiān)測裝置<b class='flag-5'>通過了</b>CQC認(rèn)證意味著什么?

    【RA4M2-SENSOR】3、使用GPT定時器-PWM輸出

    這是通過軟件來實(shí)現(xiàn)的,GPT 硬件本身不支持輸出單個脈沖(One-Shot)功能。 當(dāng)使用單個脈沖(One-Shot)模式時,必須要開啟中斷,計時器需要在脈沖周期結(jié)束后在 ISR 中斷服務(wù)函數(shù)中被停止
    發(fā)表于 09-01 15:20

    為什么現(xiàn)在的PCB大部分都是綠色?PCB 不同的顏色到底代表什么意思?

    都是色粉的配色。我們通過絲網(wǎng)印刷將顏色印刷到PCB上。PCB顏色有綠色、黑色、藍(lán)色、黃色、紫色、紅色和棕色。還有一些廠家別出心裁地開發(fā)出了白色、粉色等多種顏色的P
    的頭像 發(fā)表于 07-18 10:03 ?1966次閱讀
    為什么現(xiàn)在的PCB<b class='flag-5'>大部分</b>都是綠色?PCB 不同的顏色到底代表什么意思?

    四方光電粒子計數(shù)器通過UL61010-1認(rèn)證,安全性能獲國際認(rèn)可

    近期,四方光電塵埃粒子計數(shù)器 OPC-6303UL 通過了 UL 61010-1 的測試,獲得 UL 的正式認(rèn)可。這不僅是對產(chǎn)品質(zhì)量和安全性的認(rèn)可,也為其在國際市場的推廣提供了有力支持。
    的頭像 發(fā)表于 07-02 10:20 ?508次閱讀
    四方光電粒子計數(shù)器<b class='flag-5'>通過</b>UL61010-1認(rèn)證,安全性能獲國際認(rèn)可

    震驚,原來大部分電器都離不開它

    大部分電器都離不開變壓器嗎 是的,絕大多數(shù)電器設(shè)備都直接或間接依賴變壓器,但具體形式因用電場景而異。以下是詳細(xì)分析: 1. 哪些電器必須用變壓器? 交流電(AC)設(shè)備: 家用電器
    的頭像 發(fā)表于 06-24 14:10 ?1047次閱讀

    【技術(shù)分享】從EMC到極限溫升,插板式模組都通過了哪些“地獄測試”?

    插板式模組是ZLG致遠(yuǎn)電子開發(fā)的可靈活設(shè)計的遠(yuǎn)程I/O擴(kuò)展模塊,可通過定制化底板集成各類接口,搭配多種功能模塊,那它們的穩(wěn)定性能得到保證嗎?本文來講一講插板式模組經(jīng)歷的那些“地獄測試”。九大測試
    的頭像 發(fā)表于 06-17 11:36 ?829次閱讀
    【技術(shù)分享】從EMC到極限溫升,插板式模組都<b class='flag-5'>通過了</b>哪些“地獄<b class='flag-5'>測試</b>”?

    知行科技全資子公司擬收購小工匠機(jī)器人大部分股份

    近日,知行科技旗下專注機(jī)器人研發(fā)及商業(yè)化的全資子公司艾摩星機(jī)器人與蘇州小工匠機(jī)器人有限公司(“小工匠”)簽署股權(quán)轉(zhuǎn)讓框架協(xié)議,艾摩星機(jī)器人將出資收購小工匠大部分股份,成為控股股東。以此為開端,知行科技正快速提升在機(jī)器人關(guān)鍵部件層面的技術(shù)積累,在加速拓展具體場景應(yīng)用方面,邁出堅實(shí)一步。
    的頭像 發(fā)表于 05-13 14:51 ?970次閱讀

    【RA-Eco-RA4M2開發(fā)板評測】RA-Eco-RA4M2 PWM輸出

    } 筆者這里只是使用了R_GPT_Open()和R_GPT_Start()函數(shù),就是公用默認(rèn)的頻率和占空比就好了。 大部分初始化的工作已經(jīng)通過軟件生成了,因此實(shí)現(xiàn)起來就比較簡單。
    發(fā)表于 04-28 22:57