91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

最基礎(chǔ)的半監(jiān)督學(xué)習(xí)

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 作者:Neeraj varshney ? 2020-11-02 16:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀

最基礎(chǔ)的半監(jiān)督學(xué)習(xí)的概念,給大家一個(gè)感性的認(rèn)識(shí)。

半監(jiān)督學(xué)習(xí)(SSL)是一種機(jī)器學(xué)習(xí)技術(shù),其中任務(wù)是從一個(gè)小的帶標(biāo)簽的數(shù)據(jù)集和相對(duì)較大的未帶標(biāo)簽的數(shù)據(jù)中學(xué)習(xí)得到的。SSL的目標(biāo)是要比單獨(dú)使用有標(biāo)記數(shù)據(jù)訓(xùn)練的監(jiān)督學(xué)習(xí)技術(shù)得到更好的結(jié)果。這是半監(jiān)督學(xué)習(xí)系列文章的第1部分,對(duì)這個(gè)機(jī)器學(xué)習(xí)的重要子領(lǐng)域進(jìn)行了簡(jiǎn)要的介紹。

區(qū)分半監(jiān)督學(xué)習(xí),監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)

整個(gè)數(shù)據(jù)集中可用于訓(xùn)練的有標(biāo)記數(shù)據(jù)的范圍區(qū)分了機(jī)器學(xué)習(xí)的這三個(gè)相關(guān)領(lǐng)域。

監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)中最流行的模式,在這種模式中,可以通過(guò)標(biāo)簽的形式獲得完整的監(jiān)督。整個(gè)數(shù)據(jù)集都有標(biāo)記,即一個(gè)標(biāo)簽與訓(xùn)練數(shù)據(jù)集中的每個(gè)樣本相關(guān)聯(lián)。機(jī)器學(xué)習(xí)模型使用這個(gè)標(biāo)簽數(shù)據(jù)集訓(xùn)練,并期望對(duì)新的樣本預(yù)測(cè)一個(gè)標(biāo)簽。監(jiān)督學(xué)習(xí)主要包括兩類任務(wù):分類和回歸。分類問(wèn)題要求算法預(yù)測(cè)一個(gè)離散值,而回歸任務(wù)是需要從輸入變量(X)逼近一個(gè)映射函數(shù)(f)到連續(xù)輸出變量(y)。

手寫數(shù)字識(shí)別使用(MNIST)數(shù)據(jù)集。每個(gè)樣本都有一個(gè)圖像和對(duì)應(yīng)的數(shù)字作為標(biāo)簽。任務(wù)是學(xué)習(xí)從圖像中預(yù)測(cè)標(biāo)簽(即數(shù)字)。

另一個(gè)例子是情感分類,使用IMDB數(shù)據(jù)集。每條記錄都包含一個(gè)評(píng)論和一個(gè)相應(yīng)的標(biāo)簽(正面的或負(fù)面的)。這里的任務(wù)是預(yù)測(cè)給定評(píng)論的情緒。

房?jī)r(jià)預(yù)測(cè)是一個(gè)回歸任務(wù),其中標(biāo)簽(房?jī)r(jià))是一個(gè)連續(xù)變量。

在無(wú)監(jiān)督學(xué)習(xí)中,沒有標(biāo)記數(shù)據(jù)可用。訓(xùn)練數(shù)據(jù)集包含樣本,但沒有特定的期望結(jié)果或標(biāo)簽。機(jī)器學(xué)習(xí)模型試圖通過(guò)提取有用的特征并對(duì)其進(jìn)行分析來(lái)自動(dòng)地在數(shù)據(jù)中找到結(jié)構(gòu)。像聚類、異常檢測(cè)、關(guān)聯(lián)等任務(wù)屬于無(wú)監(jiān)督學(xué)習(xí)。

聚類是將數(shù)據(jù)集劃分為多個(gè)簇,使同一簇中的數(shù)據(jù)點(diǎn)與同一簇中的其他數(shù)據(jù)點(diǎn)更相似,與其他簇中的數(shù)據(jù)點(diǎn)不相似。例如,下圖(左)中的數(shù)據(jù)點(diǎn)可以分成3個(gè)簇,如圖(右)所示。注意,簇可以是任何形狀。

半監(jiān)督式學(xué)習(xí)(SSL),正如其名稱所示,介于兩個(gè)極端之間(監(jiān)督式是指整個(gè)數(shù)據(jù)集被標(biāo)記,而非監(jiān)督式是指沒有標(biāo)記)。半監(jiān)督學(xué)習(xí)任務(wù)具有一個(gè)標(biāo)記和一個(gè)未標(biāo)記的數(shù)據(jù)集。它使用未標(biāo)記的數(shù)據(jù)來(lái)獲得對(duì)數(shù)據(jù)結(jié)構(gòu)的更多理解。通常,SSL使用小的帶標(biāo)簽數(shù)據(jù)集和較大的未帶標(biāo)簽數(shù)據(jù)集來(lái)進(jìn)行學(xué)習(xí)。

我們的目標(biāo)是學(xué)習(xí)一個(gè)預(yù)測(cè)器來(lái)預(yù)測(cè)未來(lái)的測(cè)試數(shù)據(jù),這個(gè)預(yù)測(cè)器比單獨(dú)從有標(biāo)記的訓(xùn)練數(shù)據(jù)中學(xué)習(xí)的預(yù)測(cè)器更好。

監(jiān)督學(xué)習(xí),半監(jiān)督學(xué)習(xí),無(wú)監(jiān)督學(xué)習(xí)在標(biāo)記數(shù)據(jù)上的差別可視化

為什么要關(guān)注半監(jiān)督學(xué)習(xí)

在許多實(shí)際應(yīng)用中,收集大的有標(biāo)簽數(shù)據(jù)集太昂貴或者不可行,但是有大量的無(wú)標(biāo)簽數(shù)據(jù)可用。對(duì)于這種情況,半監(jiān)督學(xué)習(xí)是一個(gè)完美的方案。SSL技術(shù)可以利用帶標(biāo)簽的數(shù)據(jù),也可以從未帶標(biāo)簽的數(shù)據(jù)派生結(jié)構(gòu),從而更好地解決總體任務(wù)。

典型的監(jiān)督學(xué)習(xí)算法在標(biāo)記數(shù)據(jù)集較小的情況下,容易出現(xiàn)過(guò)擬合問(wèn)題。SSL通過(guò)在訓(xùn)練過(guò)程中理解未標(biāo)記數(shù)據(jù)的結(jié)構(gòu)來(lái)緩解這個(gè)問(wèn)題。

此外,這種學(xué)習(xí)技術(shù)減輕了構(gòu)建大量標(biāo)記數(shù)據(jù)集來(lái)學(xué)習(xí)任務(wù)的負(fù)擔(dān)。SSL方法更接近我們?nèi)祟惖膶W(xué)習(xí)方式。

讓我們舉個(gè)例子來(lái)直觀地看看半監(jiān)督學(xué)習(xí)的效果。在下面的圖中,當(dāng)只對(duì)標(biāo)記數(shù)據(jù)(大的黑點(diǎn)和白點(diǎn))進(jìn)行訓(xùn)練(即對(duì)標(biāo)記數(shù)據(jù)進(jìn)行監(jiān)督學(xué)習(xí))時(shí),決策邊界(虛線)并不遵循數(shù)據(jù)“流形”的輪廓,這可以由額外的未標(biāo)記數(shù)據(jù)(小灰點(diǎn))來(lái)表示。

因此,SSL的目標(biāo)是利用未標(biāo)記數(shù)據(jù)來(lái)生成決策邊界,從而更好地反映數(shù)據(jù)的底層結(jié)構(gòu)。

由不同的半監(jiān)督學(xué)習(xí)方法生成的決策邊界

半監(jiān)督學(xué)習(xí)的任務(wù)舉例

CIFAR-10— 它是由10個(gè)類的32×32像素的RGB圖像組成的數(shù)據(jù)集,任務(wù)是圖像分類。通常使用Tiny Images數(shù)據(jù)集中的隨機(jī)圖像來(lái)形成未標(biāo)記數(shù)據(jù)集。

SVHN— 街景門牌號(hào)數(shù)據(jù)集由真實(shí)門牌號(hào)的32×32像素的RGB圖像組成,任務(wù)是分類最中間的數(shù)字。它附帶一個(gè)“SVHN-extra”數(shù)據(jù)集,該數(shù)據(jù)集由531,131個(gè)額外的數(shù)字圖像組成,可以用作未標(biāo)記數(shù)據(jù)。

Text-Classification Tasks— 亞馬遜評(píng)論數(shù)據(jù)庫(kù),Yelp評(píng)論數(shù)據(jù)集。

總結(jié)

半監(jiān)督學(xué)習(xí)是一種有趣的方法,用于解決機(jī)器學(xué)習(xí)中缺乏標(biāo)記數(shù)據(jù)的問(wèn)題。SSL算法還利用未標(biāo)記數(shù)據(jù)來(lái)提高監(jiān)督學(xué)習(xí)算法的性能。SSL算法通常提供了一種從無(wú)標(biāo)簽示例中了解數(shù)據(jù)結(jié)構(gòu)的方法,減輕了對(duì)標(biāo)簽的需求。

本系列的第2部分會(huì)介紹了一些具體的SSL技術(shù),未完待續(xù)。

責(zé)任編輯:xj

原文標(biāo)題:半監(jiān)督學(xué)習(xí)入門基礎(chǔ)(一)

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SSL
    SSL
    +關(guān)注

    關(guān)注

    0

    文章

    132

    瀏覽量

    26747
  • 半監(jiān)督
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    6458
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8553

    瀏覽量

    136948
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5599

    瀏覽量

    124398

原文標(biāo)題:半監(jiān)督學(xué)習(xí)入門基礎(chǔ)(一)

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    算法工程師需要具備哪些技能?

    :自動(dòng)化任務(wù)(如數(shù)據(jù)預(yù)處理、模型訓(xùn)練調(diào)度)。Git版本控制:團(tuán)隊(duì)協(xié)作開發(fā)(如分支管理、代碼合并)。 機(jī)器學(xué)習(xí)監(jiān)督學(xué)習(xí):線性回歸、邏輯回歸、決策樹、SVM等。無(wú)監(jiān)督學(xué)習(xí):聚類(K-Means)、降維
    發(fā)表于 02-27 10:53

    強(qiáng)化學(xué)習(xí)會(huì)讓自動(dòng)駕駛模型學(xué)習(xí)更快嗎?

    是一種讓機(jī)器通過(guò)“試錯(cuò)”學(xué)會(huì)決策的辦法。與監(jiān)督學(xué)習(xí)不同,監(jiān)督學(xué)習(xí)是有人提供示范答案,讓模型去模仿;而強(qiáng)化學(xué)習(xí)不會(huì)把每一步的“正確答案”都告訴你,而是把環(huán)境、動(dòng)作和結(jié)果連起來(lái),讓機(jī)器自己探索哪個(gè)行為長(zhǎng)期看起來(lái)更有利
    的頭像 發(fā)表于 01-31 09:34 ?643次閱讀
    強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>會(huì)讓自動(dòng)駕駛模型<b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    UCC27212 橋驅(qū)動(dòng)器技術(shù)詳解

    UCC27212 橋驅(qū)動(dòng)器技術(shù)詳解 在電子工程領(lǐng)域,功率轉(zhuǎn)換和控制電路對(duì)于各種應(yīng)用至關(guān)重要。而驅(qū)動(dòng)器作為其中的關(guān)鍵組件,其性能直接影響著整個(gè)系統(tǒng)的效率和穩(wěn)定性。今天,我們就來(lái)深入了解一款高性能的
    的頭像 發(fā)表于 01-08 17:30 ?702次閱讀

    FRDMGD3160DSBHB橋評(píng)估板:設(shè)計(jì)與應(yīng)用指南

    FRDMGD3160DSBHB橋評(píng)估板:設(shè)計(jì)與應(yīng)用指南 在電子工程領(lǐng)域,一款性能優(yōu)良的評(píng)估板對(duì)于產(chǎn)品的開發(fā)和測(cè)試至關(guān)重要。今天,我們就來(lái)深入了解一下NXP的FRDMGD3160DSBHB橋評(píng)估板
    的頭像 發(fā)表于 12-25 10:55 ?576次閱讀

    SRN8040HA系列屏蔽功率電感器:特性、參數(shù)與應(yīng)用考量

    SRN8040HA系列屏蔽功率電感器:特性、參數(shù)與應(yīng)用考量 在電子工程師的日常工作中,功率電感器是電路設(shè)計(jì)里的常用元件。今天,我們來(lái)深入探討一下Bourns的SRN8040HA系列屏蔽功率電感器
    的頭像 發(fā)表于 12-23 15:10 ?394次閱讀

    【團(tuán)購(gòu)】獨(dú)家全套珍藏!龍哥LabVIEW視覺深度學(xué)習(xí)實(shí)戰(zhàn)課(11大系列課程,共5000+分鐘)

    趨勢(shì): 無(wú)監(jiān)督學(xué)習(xí)普及 當(dāng)前工業(yè)場(chǎng)景中80%的缺陷檢測(cè)項(xiàng)目面臨\"OK樣本充足而NG樣本稀缺\"的困境,傳統(tǒng)監(jiān)督學(xué)習(xí)方案難以落地。課程第11系列(無(wú)監(jiān)督缺陷檢測(cè)篇)提供無(wú)需標(biāo)注即可
    發(fā)表于 12-04 09:28

    自動(dòng)駕駛數(shù)據(jù)標(biāo)注是所有信息都要標(biāo)注嗎?

    本身只是像素和點(diǎn)云。標(biāo)注的工作就是人為地給這些信號(hào)貼上語(yǔ)義標(biāo)簽,告訴模型這是一輛車、這是行人、這是車道線、這個(gè)區(qū)域不能通行之類的明確信息。沒有這些標(biāo)簽,監(jiān)督學(xué)習(xí)、驗(yàn)證和評(píng)估都無(wú)法進(jìn)行,模型不知道哪些輸入與哪些輸出應(yīng)該
    的頭像 發(fā)表于 12-04 09:05 ?868次閱讀
    自動(dòng)駕駛數(shù)據(jù)標(biāo)注是所有信息都要標(biāo)注嗎?

    【團(tuán)購(gòu)】獨(dú)家全套珍藏!龍哥LabVIEW視覺深度學(xué)習(xí)實(shí)戰(zhàn)課程(11大系列課程,共5000+分鐘)

    趨勢(shì): 無(wú)監(jiān)督學(xué)習(xí)普及 當(dāng)前工業(yè)場(chǎng)景中80%的缺陷檢測(cè)項(xiàng)目面臨\"OK樣本充足而NG樣本稀缺\"的困境,傳統(tǒng)監(jiān)督學(xué)習(xí)方案難以落地。課程第11系列(無(wú)監(jiān)督缺陷檢測(cè)篇)提供無(wú)需標(biāo)注即可
    發(fā)表于 12-03 13:50

    自動(dòng)駕駛中常提的“強(qiáng)化學(xué)習(xí)”是個(gè)啥?

    下,就是一個(gè)智能體在環(huán)境里行動(dòng),它能觀察到環(huán)境的一些信息,并做出一個(gè)動(dòng)作,然后環(huán)境會(huì)給出一個(gè)反饋(獎(jiǎng)勵(lì)或懲罰),智能體的目標(biāo)是把長(zhǎng)期得到的獎(jiǎng)勵(lì)累積到最大。和監(jiān)督學(xué)習(xí)不同,強(qiáng)化學(xué)習(xí)沒有一一對(duì)應(yīng)的“正確答案”給它看,而是靠與環(huán)境交互、自我探索來(lái)發(fā)現(xiàn)
    的頭像 發(fā)表于 10-23 09:00 ?673次閱讀
    自動(dòng)駕駛中常提的“強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>”是個(gè)啥?

    LLC 橋諧振電路的設(shè)計(jì)與應(yīng)用

    電子發(fā)燒友網(wǎng)站提供《LLC 橋諧振電路的設(shè)計(jì)與應(yīng)用.pdf》資料免費(fèi)下載
    發(fā)表于 10-22 17:11 ?8次下載

    XM3橋電源模塊系列CREE

    XM3橋電源模塊系列是 Wolfspeed(原CREE)推出的高功率碳化硅(SiC)電源模塊平臺(tái),專為電動(dòng)汽車、工業(yè)電源和牽引驅(qū)動(dòng)等高要求應(yīng)用設(shè)計(jì)。XM3橋電源模塊系列采用第三代 SiC
    發(fā)表于 09-11 09:48

    任正非說(shuō) AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進(jìn)來(lái)呢?

    的基本理論。了解監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的基本原理。例如,在監(jiān)督學(xué)習(xí)中,理解如何通過(guò)標(biāo)注數(shù)據(jù)來(lái)訓(xùn)練模型進(jìn)行分類或回歸任務(wù),像通過(guò)大量的貓和狗的圖片標(biāo)注數(shù)據(jù)來(lái)訓(xùn)練一個(gè)圖像分類模型,
    發(fā)表于 07-08 17:44

    HT8 橋電磁爐MCU應(yīng)用須知

    本文介紹了基于HT8的橋電磁爐設(shè)計(jì)方案
    發(fā)表于 07-07 10:26 ?7次下載

    機(jī)器學(xué)習(xí)異常檢測(cè)實(shí)戰(zhàn):用Isolation Forest快速構(gòu)建無(wú)標(biāo)簽異常檢測(cè)系統(tǒng)

    本文轉(zhuǎn)自:DeepHubIMBA無(wú)監(jiān)督異常檢測(cè)作為機(jī)器學(xué)習(xí)領(lǐng)域的重要分支,專門用于在缺乏標(biāo)記數(shù)據(jù)的環(huán)境中識(shí)別異常事件。本文深入探討異常檢測(cè)技術(shù)的理論基礎(chǔ)與實(shí)踐應(yīng)用,通過(guò)IsolationForest
    的頭像 發(fā)表于 06-24 11:40 ?1414次閱讀
    機(jī)器<b class='flag-5'>學(xué)習(xí)</b>異常檢測(cè)實(shí)戰(zhàn):用Isolation Forest快速構(gòu)建無(wú)標(biāo)簽異常檢測(cè)系統(tǒng)

    使用MATLAB進(jìn)行無(wú)監(jiān)督學(xué)習(xí)

    無(wú)監(jiān)督學(xué)習(xí)是一種根據(jù)未標(biāo)注數(shù)據(jù)進(jìn)行推斷的機(jī)器學(xué)習(xí)方法。無(wú)監(jiān)督學(xué)習(xí)旨在識(shí)別數(shù)據(jù)中隱藏的模式和關(guān)系,無(wú)需任何監(jiān)督或關(guān)于結(jié)果的先驗(yàn)知識(shí)。
    的頭像 發(fā)表于 05-16 14:48 ?1438次閱讀
    使用MATLAB進(jìn)行無(wú)<b class='flag-5'>監(jiān)督學(xué)習(xí)</b>