在一篇新論文中,F(xiàn)rankle及其同事發(fā)現(xiàn)了潛伏在BERT中的此類子網(wǎng),BERT是一種用于自然語言處理(NLP)的先進(jìn)神經(jīng)網(wǎng)絡(luò)方法。作為人工智能的一個分支,NLP旨在通過預(yù)測文本生成或在線聊天機(jī)器人等應(yīng)用程序來解密和分析人類語言。在計算方面,BERT體積龐大,通常需要大多數(shù)用戶無法獲得的超級計算能力。從而可能使更多用戶在智能手機(jī)上開發(fā)有效的NLP工具。
弗蘭克勒說:“我們正在達(dá)到必須使這些模型更精簡,更高效的地步。”他補(bǔ)充說,這一進(jìn)步有一天可能會“減少NLP的準(zhǔn)入門檻”。
麻省理工學(xué)院計算機(jī)科學(xué)與人工智能實驗室的邁克爾·卡賓小組的博士生Frankle是該研究的共同作者,該研究將于下個月在神經(jīng)信息處理系統(tǒng)會議上發(fā)表。德克薩斯大學(xué)奧斯汀分校的陳天龍是該論文的主要作者,其中包括得克薩斯州A&M的合作者Wang Zhangyang Wang,以及所有MIT-IBM Watson AI Lab的常石宇,劉思佳和張揚(yáng)。
您今天可能已經(jīng)與BERT網(wǎng)絡(luò)進(jìn)行了互動。這是Google搜索引擎的基礎(chǔ)技術(shù)之一,自Google于2018年發(fā)布BERT以來,它一直引起研究人員的興奮。BERT是一種創(chuàng)建神經(jīng)網(wǎng)絡(luò)的方法-使用分層節(jié)點或“神經(jīng)元”的算法來學(xué)習(xí)執(zhí)行通過培訓(xùn)大量實例來完成一項任務(wù)。
BERT是通過反復(fù)嘗試填寫寫作段落中遺漏的單詞來進(jìn)行訓(xùn)練的,它的功能在于此初始訓(xùn)練數(shù)據(jù)集的龐大大小。然后,用戶可以將BERT的神經(jīng)網(wǎng)絡(luò)微調(diào)至特定任務(wù),例如構(gòu)建客戶服務(wù)聊天機(jī)器人。但是爭吵的BERT需要大量的處理能力。
弗蘭克爾說:“如今,標(biāo)準(zhǔn)的BERT模型-園林品種-具有3.4億個參數(shù),”他補(bǔ)充說,這個數(shù)字可以達(dá)到10億。對如此龐大的網(wǎng)絡(luò)進(jìn)行微調(diào)可能需要一臺超級計算機(jī)。“這簡直太貴了。這遠(yuǎn)遠(yuǎn)超出了您或我的計算能力?!?/p>
為了削減計算成本,Chen和他的同事試圖找出隱藏在BERT中的較小模型。他們通過迭代修剪整個BERT網(wǎng)絡(luò)的參數(shù)進(jìn)行了實驗,然后將新子網(wǎng)的性能與原始BERT模型的性能進(jìn)行了比較。他們對一系列NLP任務(wù)進(jìn)行了此比較,從回答問題到填充句子中的空白詞。
責(zé)任編輯:lq
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4839瀏覽量
108049 -
人工智能
+關(guān)注
關(guān)注
1819文章
50213瀏覽量
266476 -
自然語言處理
+關(guān)注
關(guān)注
1文章
630瀏覽量
14703
發(fā)布評論請先 登錄
RDMA設(shè)計50: 如何驗證網(wǎng)絡(luò)嗅探功能?
【「Altium Designer 25 電路設(shè)計精進(jìn)實踐」閱讀體驗】+本書概覽與內(nèi)容特點介紹
網(wǎng)線抗干擾:打造無縫網(wǎng)絡(luò)連接的基石
穩(wěn)聯(lián)技術(shù)的Profinet轉(zhuǎn)Modbus轉(zhuǎn)換網(wǎng)關(guān)與信捷PLC從站的連接配置進(jìn)行了案例分析
網(wǎng)絡(luò)接收線程erxmb異常的原因?怎么解決?
利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能
SOLIDWORKS2025在性能和響應(yīng)速度方面進(jìn)行了大幅提升
無限穿墻技術(shù)西安品茶工作室南郊北郊教學(xué)簡約網(wǎng)絡(luò)延遲
TPS62684 1600mA 高效降壓轉(zhuǎn)換器,針對小尺寸解決方案進(jìn)行了優(yōu)化數(shù)據(jù)手冊
雙電機(jī)比值聯(lián)動控制系統(tǒng)
穩(wěn)定、高效、智能:蜂鳥IP如何為技術(shù)玩家提供可靠動態(tài)IP服務(wù)?
DigiKey 應(yīng)用與技術(shù)門戶平臺已針對亞太地區(qū)進(jìn)行了本地化
松下娛樂互動(中國)公司正式成立
SOLIDWORKS?2025在電氣設(shè)計與仿真方面進(jìn)行了優(yōu)化
您今天可能已經(jīng)與BERT網(wǎng)絡(luò)進(jìn)行了互動
評論