91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

電子發(fā)燒友App

硬聲App

掃碼添加小助手

加入工程師交流群

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>PyTorch教程16.6之針對序列級和令牌級應用程序微調(diào)BERT

PyTorch教程16.6之針對序列級和令牌級應用程序微調(diào)BERT

2023-06-05 | pdf | 0.36 MB | 次下載 | 免費

資料介紹

在本章前面的章節(jié)中,我們?yōu)樽匀徽Z言處理應用設計了不同的模型,例如基于 RNNs、CNNs、attention 和 MLPs。當存在空間或時間限制時,這些模型很有用,但是,為每個自然語言處理任務制作一個特定模型實際上是不可行的。15.8 節(jié)中,我們介紹了一種預訓練模型 BERT,它需要對各種自然語言處理任務進行最少的架構(gòu)更改。一方面,在提出建議時,BERT 改進了各種自然語言處理任務的最新技術水平。另一方面,如 第 15.10 節(jié)所述,原始 BERT 模型的兩個版本帶有 1.1 億和 3.4 億個參數(shù)。因此,當有足夠的計算資源時,我們可以考慮為下游自然語言處理應用程序微調(diào) BERT。

在下文中,我們將自然語言處理應用程序的一個子集概括為序列級和標記級。在序列層面,我們介紹了如何在單個文本分類和文本對分類或回歸中將文本輸入的 BERT 表示轉(zhuǎn)換為輸出標簽在令牌級別,我們將簡要介紹文本標記和問答等新應用,并闡明 BERT 如何表示其輸入并轉(zhuǎn)換為輸出標簽。在微調(diào)期間,BERT 在不同應用程序中所需的“最小架構(gòu)更改”是額外的全連接層。在下游應用程序的監(jiān)督學習期間,額外層的參數(shù)是從頭開始學習的,而預訓練 BERT 模型中的所有參數(shù)都經(jīng)過微調(diào)。

16.6.1。單一文本分類

單文本分類以單個文本序列作為輸入并輸出其分類結(jié)果。除了我們在本章中學習的情感分析之外,語言可接受性語料庫(CoLA)也是一個用于單一文本分類的數(shù)據(jù)集,判斷給定的句子是否在語法上可以接受(Warstadt et al . , 2019例如,“我應該學習?!?是可以接受的,但“我應該學習”。不是。

https://file.elecfans.com/web2/M00/AA/48/pYYBAGR9PNKAOMgOAAIY3BeUoOE245.svg

圖 16.6.1針對單一文本分類應用微調(diào) BERT,例如情感分析和測試語言可接受性。假設輸入的單個文本有六個標記。

15.8 節(jié)描述了 BERT 的輸入表示。BERT 輸入序列明確表示單個文本和文本對,其中特殊分類標記“”用于序列分類,特殊分類標記“”標記單個文本的結(jié)尾或分隔一對文本. 如圖 16.6.1所示 ,在單文本分類應用中,特殊分類標記“”的 BERT 表示對整個輸入文本序列的信息進行編碼。作為輸入單個文本的表示,它將被送入一個由全連接(密集)層組成的小型 MLP,以輸出所有離散標簽值的分布。

16.6.2。文本對分類或回歸

我們還在本章中研究了自然語言推理。屬于文本對分類,對一對文本進行分類的一類應用。

以一對文本作為輸入但輸出連續(xù)值, 語義文本相似度是一種流行的文本對回歸任務。該任務測量句子的語義相似性。例如,在語義文本相似性基準數(shù)據(jù)集中,一對句子的相似性得分是從 0(無意義重疊)到 5(意義等同)的有序尺度Cer等人,2017 年目標是預測這些分數(shù)。來自語義文本相似性基準數(shù)據(jù)集的示例包括(句子 1、句子 2、相似性分數(shù)):

  • “一架飛機正在起飛。”,“一架飛機正在起飛?!?,5.000;

  • “一個女人在吃東西?!?,“一個女人在吃肉?!?,3.000;

  • “一個女人在跳舞?!?,“一個男人在說話。”,0.000。

https://file.elecfans.com/web2/M00/AA/48/pYYBAGR9PNWACEqbAAJBAxhpDWo066.svg

圖 16.6.2為文本對分類或回歸應用微調(diào) BERT,例如自然語言推理和語義文本相似性。假設輸入文本對有兩個和三個標記。

圖16.6.1中的單一文本分類相比,圖16.6.2中用于文本對分類的微調(diào)BERT在輸入表示上有所不同。對于語義文本相似性等文本對回歸任務,可以應用微不足道的更改,例如輸出連續(xù)的標簽值并使用均方損失:它們在回歸中很常見。

16.6.3。文本標記

現(xiàn)在讓我們考慮標記級任務,例如文本標記,其中為每個標記分配一個標簽。在文本標注任務中,詞性標注根據(jù)詞在句子中的作用為每個詞分配一個詞性標簽(例如,形容詞和限定詞)。例如,根據(jù) Penn Treebank II 標簽集,句子“John Smith's car is new”應該被標記為“NNP(名詞,專有單數(shù))NNP POS(所有格結(jié)尾)NN(名詞,單數(shù)或質(zhì)量)VB (動詞,基本形式)JJ(形容詞)”。

https://file.elecfans.com/web2/M00/AA/48/pYYBAGR9PNmAPTV9AAOwL_0zfyY715.svg

圖 16.6.3為文本標記應用微調(diào) BERT,例如詞性標記。假設輸入的單個文本有六個標記。

文本標記應用程序的微調(diào) BERT 如圖 16.6.3所示。圖 16.6.1相比,唯一的區(qū)別在于在文本標記中,輸入文本的每個標記的 BERT 表示被饋送到相同的額外全連接層以輸出標記的標簽,例如部分 -詞性標簽。

16.6.4。問答

問答作為另一個token級的應用,體現(xiàn)了閱讀理解能力。例如,斯坦福問答數(shù)據(jù)集 (SQuAD v1.1) 由閱讀文章和問題組成,其中每個問題的答案只是與問題相關的文章中的一段文本(文本跨度)(Rajpurkar 等人,2008 。 , 2016 年). 為了解釋,請考慮一段話“一些專家報告說口罩的功效尚無定論。然而,口罩制造商堅稱,他們的產(chǎn)品,如 N95 口罩,可以抵御病毒?!?以及“誰說N95口罩可以防病毒?”的問題。答案應該是段落中的文本跨度“面具制造商”。因此,SQuAD v1.1 的目標是在給定一對問題和段落的情況下預測段落中文本跨度的開始和結(jié)束。

https://file.elecfans.com/web2/M00/A9/CD/poYBAGR9PNyAASIyAANglldmxo0985.svg

圖 16.6.4為問答微調(diào) BERT。假設輸入文本對有兩個和三個標記。

為了微調(diào) BERT 以進行問答,問題和段落分別打包為 BERT 輸入中的第一和第二文本序列。為了預測文本跨度的開始位置,相同的附加全連接層將從位置通道轉(zhuǎn)換任何標記的 BERT 表示i進入標量分數(shù) si. 這樣所有passage token的得分通過softmax操作進一步轉(zhuǎn)化為概率分布,使得每個token位置i在段落中分配了一個概率pi作為文本跨度的開始。預測文本跨度的結(jié)束與上述相同,只是其附加的全連接層中的參數(shù)獨立于預測開始的參數(shù)。預測結(jié)束時,位置的任何通道令牌i由相同的全連接層轉(zhuǎn)換為標量分數(shù)ei. 圖 16.6.4描述了用于問答的微調(diào) BERT。

對于問答,監(jiān)督學習的訓練目標與最大化地面實況開始和結(jié)束位置的對數(shù)似然一樣簡單。在預測跨度時,我們可以計算分數(shù)si+ej對于位置的有效跨度i定位j(i≤j), 并輸出得分最高的跨度。

16.6.5。概括

  • BERT 需要對序列級和令牌級自然語言處理應用進行最小的架構(gòu)更改(額外的全連接層),例如單個文本分類(例如,情感分析和測試語言可接受性)、文本對分類或回歸(例如,自然語言推理和語義文本相似性)、文本標記(例如,詞性標記)和問題回答。

  • 在下游應用程序的監(jiān)督學習期間,額外層的參數(shù)是從頭開始學習的,而預訓練 BERT 模型中的所有參數(shù)都經(jīng)過微調(diào)。

16.6.6。練習

  1. 讓我們?yōu)樾侣勎恼略O計一個搜索引算法。當系統(tǒng)收到查詢(例如,“冠狀病毒爆發(fā)期間的石油工業(yè)”)時,它應該返回與查詢最相關的新聞文章的排名列表。假設我們有大量新聞文章和大量查詢。為了簡化問題,假設已為每個查詢標記了最相關的文章。我們?nèi)绾?在算法設計中應用負采樣(參見第 15.2.1 節(jié))和 BERT?

  2. 我們?nèi)绾卫?BERT 訓練語言模型?

  3. 我們可以在機器翻譯中利用 BERT 嗎?

Discussions


序列 自然語言處理 pytorch
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1耗盡型MOS FET產(chǎn)品目錄選型表
  2. 0.14 MB   |  3次下載  |  免費
  3. 2斯丹電子 | 用于芯片測試系統(tǒng)的射頻干簧繼電器
  4. 5.11 MB  |  次下載  |  免費
  5. 3WAYON維安手機快充保護方案由原廠代理分銷經(jīng)銷一級代理分銷經(jīng)銷
  6. 719.04 KB  |  次下載  |  免費
  7. 4WAYON維安手機EOS防護器件選型指南
  8. 293.78 KB  |  次下載  |  免費
  9. 5PC5012氮化鎵 PIIP 單片集成電路數(shù)據(jù)手冊
  10. 1.66 MB   |  次下載  |  免費
  11. 6合眾恒躍復旦微FMQL20SM BTB板簡介
  12. 908.98 KB  |  次下載  |  免費
  13. 7HERO8Black說明書
  14. 4.96 MB   |  次下載  |  免費
  15. 8三菱E540說明書
  16. 3.93 MB   |  次下載  |  免費

本月

  1. 1美的電磁爐電路原理圖資料
  2. 4.39 MB   |  19次下載  |  10 積分
  3. 2反激式開關電源設計解析
  4. 0.89 MB   |  11次下載  |  5 積分
  5. 3耗盡型MOS FET產(chǎn)品目錄選型表
  6. 0.14 MB   |  3次下載  |  免費
  7. 4簡易光伏控制器原理圖資料
  8. 0.07 MB   |  1次下載  |  5 積分
  9. 5FP7135V060-G1/FP7125替代物料pin to pin
  10. 495.40 KB  |  1次下載  |  免費
  11. 62EDL05x06xx系列 600V半橋門驅(qū)動器帶集成自舉二極管(BSD)手冊
  12. 0.69 MB   |  1次下載  |  免費
  13. 7壓力容器焊接手冊
  14. 6.47 MB   |  次下載  |  2 積分
  15. 8SFI立昌SFI-Company原廠代理分銷經(jīng)銷一級代理分銷經(jīng)銷
  16. 1.58 MB  |  次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935137次下載  |  10 積分
  3. 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設計
  4. 1.48MB  |  420064次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233095次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費下載
  8. 340992  |  191456次下載  |  10 積分
  9. 5十天學會AVR單片機與C語言視頻教程 下載
  10. 158M  |  183360次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81605次下載  |  10 積分
  13. 7Keil工具MDK-Arm免費下載
  14. 0.02 MB  |  73831次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65991次下載  |  10 積分