91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)特征工程的五個(gè)方面優(yōu)點(diǎn)

汽車(chē)玩家 ? 來(lái)源:今日頭條 ? 作者:不一樣的程序猿 ? 2020-03-15 16:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

特征工程是用數(shù)學(xué)轉(zhuǎn)換的方法將原始輸入數(shù)據(jù)轉(zhuǎn)換為用于機(jī)器學(xué)習(xí)模型的新特征。特征工程提高了機(jī)器學(xué)習(xí)模型的準(zhǔn)確度和計(jì)算效率,體現(xiàn)在以下五個(gè)方面

1、把原始數(shù)據(jù)轉(zhuǎn)換成與目標(biāo)相關(guān)的數(shù)據(jù)

我們可以使用特征工程對(duì)原始數(shù)據(jù)進(jìn)行轉(zhuǎn)換,使其更接近目標(biāo)變量,轉(zhuǎn)換后的特征對(duì)目標(biāo)更有預(yù)測(cè)性。在這種情況下,雖然未加工輸入出現(xiàn)在原始數(shù)據(jù)集中,但如果將轉(zhuǎn)換后的特征作為輸入,則機(jī)器學(xué)習(xí)將提高預(yù)測(cè)的準(zhǔn)確性。

2、引入額外的數(shù)據(jù)源

特征工程可以使從業(yè)者向機(jī)器學(xué)習(xí)模型引入額外的數(shù)據(jù)源。對(duì)于首次注冊(cè)的用戶,我們可以猜測(cè)該用戶的終生價(jià)值。在眾多指標(biāo)中,我們可以捕捉每個(gè)用戶的地理位置。雖然這個(gè)數(shù)據(jù)可以直接作為分類(lèi)特征(例如,IP地址和郵政編碼)提供,但模型基于這些來(lái)確定位置信息仍存在困難。

通過(guò)第三方的人口統(tǒng)計(jì)數(shù)據(jù),我們可以做的更好。例如,這將允許我們計(jì)算每個(gè)用戶區(qū)域的平均收入和人口密度,并把這些因素直接插入到訓(xùn)練集中?,F(xiàn)在,這些預(yù)測(cè)性因素立即變得更容易推斷,而不是依賴模型從原始位置數(shù)據(jù)推斷這種微妙的關(guān)系。更進(jìn)一步,位置信息轉(zhuǎn)換成收入和人口密度的特征工程,可使我們估計(jì)這些位置衍生出的特征哪一個(gè)更為重要。

3、使用非結(jié)構(gòu)化的數(shù)據(jù)源

特征工程可使我們?cè)跈C(jī)器學(xué)習(xí)模型中使用非結(jié)構(gòu)化的數(shù)據(jù)源。許多數(shù)據(jù)源本質(zhì)上并不是結(jié)構(gòu)化的特征向量。非結(jié)構(gòu)化數(shù)據(jù),如文本、時(shí)間序列、圖像、視頻、日志數(shù)據(jù)和點(diǎn)擊流等,占創(chuàng)建數(shù)據(jù)的絕大多數(shù)。特征工程使從業(yè)者從上述原始數(shù)據(jù)流中產(chǎn)生機(jī)器學(xué)習(xí)的特征向量。

4、創(chuàng)建更容易解釋的特征

特征工程使機(jī)器學(xué)習(xí)的從業(yè)者能夠創(chuàng)建更易于解釋和實(shí)用的特征。通常,使用機(jī)器學(xué)習(xí)發(fā)現(xiàn)數(shù)據(jù)中的模式,對(duì)于產(chǎn)生精確的預(yù)測(cè)十分有用,但會(huì)遇到模型的可解釋性和模型的最終應(yīng)用的一些限制。這些情況下,在驅(qū)動(dòng)數(shù)據(jù)生成、鏈接原始數(shù)據(jù)和目標(biāo)變量的過(guò)程中,產(chǎn)生更有指示性的新特征,這樣更有價(jià)值。

5、用大特征集提高創(chuàng)造性

特征工程使得我們可以扔進(jìn)大量的特征,觀察它們代表了什么。我們能創(chuàng)建盡可能多的數(shù)據(jù),觀察在訓(xùn)練模型中哪些更有預(yù)測(cè)力。這使得機(jī)器學(xué)習(xí)的從業(yè)者在創(chuàng)建和測(cè)試特征時(shí)擺脫僵化心理,并能夠發(fā)現(xiàn)新的趨勢(shì)和模式。

雖然當(dāng)幾十個(gè)甚至上百個(gè)特征用于訓(xùn)練機(jī)器學(xué)習(xí)模型時(shí),過(guò)擬合成為一個(gè)問(wèn)題,但嚴(yán)謹(jǐn)?shù)奶卣鬟x擇算法,可減少特征使其易于管理。例如,我們可以自主選擇前10個(gè)特征的預(yù)測(cè),與所有1000個(gè)特征的預(yù)測(cè)是一樣好,還是優(yōu)于后者。

特征工程

引自《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》

在機(jī)器學(xué)習(xí)應(yīng)用領(lǐng)域中,特征工程扮演著非常重要的角色,可以說(shuō)特征工程是機(jī)器學(xué)習(xí)應(yīng)用的基礎(chǔ)。在機(jī)器學(xué)習(xí)業(yè)界流傳著這樣一句話:“數(shù)據(jù)和特征決定了機(jī)器學(xué)習(xí)算法的上限,而模型和算法只是不斷逼近而已?!痹跈C(jī)器學(xué)習(xí)應(yīng)用中,特征工程介于“數(shù)據(jù)”和“模型”之間,特征工程是使用數(shù)據(jù)的專業(yè)領(lǐng)域知識(shí)創(chuàng)建能夠使機(jī)器學(xué)習(xí)算法工作的特征的過(guò)程,而好的數(shù)據(jù)勝于多的數(shù)據(jù)。美國(guó)計(jì)算機(jī)科學(xué)家Peter Norvig有兩句經(jīng)典名言:“基于大量數(shù)據(jù)的簡(jiǎn)單模型勝于少量數(shù)據(jù)的復(fù)雜模型。”以及“更多的數(shù)據(jù)勝于聰明的算法,而好的數(shù)據(jù)勝于多的數(shù)據(jù)?!币虼?,特征工程的前提是收集足夠多的數(shù)據(jù),其次是從大量數(shù)據(jù)中提取關(guān)鍵信息并表示為模型所需要的形式。合適的特征可以讓模型預(yù)測(cè)更加容易,機(jī)器學(xué)習(xí)應(yīng)用更有可能成功。

引自《美團(tuán)機(jī)器學(xué)習(xí)》

在監(jiān)督機(jī)器學(xué)習(xí)過(guò)程中,我們使用數(shù)據(jù)教自動(dòng)系統(tǒng)如何做出準(zhǔn)確的決策。機(jī)器學(xué)習(xí)算法被設(shè)計(jì)成發(fā)現(xiàn)模式和歷史訓(xùn)練數(shù)據(jù)間的聯(lián)系;它們從數(shù)據(jù)中學(xué)習(xí)并將學(xué)習(xí)結(jié)果編碼到模型中,從而對(duì)新數(shù)據(jù)的重要屬性做出準(zhǔn)確的預(yù)測(cè)。因此,訓(xùn)練數(shù)據(jù)是機(jī)器學(xué)習(xí)中的基本問(wèn)題。有了高質(zhì)量的數(shù)據(jù),就可以捕捉到細(xì)微的差別和關(guān)聯(lián)關(guān)系,從而建立高保真的預(yù)測(cè)系統(tǒng)。相反,若訓(xùn)練數(shù)據(jù)質(zhì)量不佳,則再好的機(jī)器學(xué)習(xí)算法也無(wú)濟(jì)于事。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    算法工程師需要具備哪些技能?

    算法工程師需要掌握一系列跨學(xué)科的技能,涵蓋數(shù)學(xué)基礎(chǔ)、編程能力、算法理論、工程實(shí)踐以及業(yè)務(wù)理解等多個(gè)方面。 以下是具體技能及學(xué)習(xí)建議: 線性代數(shù)核心內(nèi)容:矩陣運(yùn)算、
    發(fā)表于 02-27 10:53

    機(jī)器學(xué)習(xí)特征工程:分類(lèi)變量的數(shù)值化處理方法

    編碼是機(jī)器學(xué)習(xí)流程里最容易被低估的環(huán)節(jié)之一,模型沒(méi)辦法直接處理文本形式的分類(lèi)數(shù)據(jù),尺寸(Small/Medium/Large)、顏色(Red/Blue/Green)、城市、支付方式等都是典型的分類(lèi)
    的頭像 發(fā)表于 02-10 15:58 ?346次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>特征</b><b class='flag-5'>工程</b>:分類(lèi)變量的數(shù)值化處理方法

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    無(wú)論你是剛?cè)腴T(mén)還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見(jiàn)錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?204次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 <b class='flag-5'>個(gè)</b>常見(jiàn)錯(cuò)誤與局限性

    個(gè)方面幫您分辨光纜是否優(yōu)質(zhì)?

    光纜是由纜芯、加強(qiáng)鋼絲、填充物和護(hù)套等幾部分組成,另外根據(jù)需要還有防水層、緩沖層、絕緣金屬導(dǎo)線等構(gòu)件。 個(gè)方面幫您分辨光纜是否優(yōu)質(zhì)? 1、填充物油膏:它是存在于松套管中的物質(zhì),主要含有纖膏與纜膏
    的頭像 發(fā)表于 12-25 10:05 ?58次閱讀

    工程師實(shí)戰(zhàn)指南:關(guān)于離子捕捉劑應(yīng)用的個(gè)關(guān)鍵問(wèn)題與解答

    在考慮使用離子捕捉劑時(shí),工程師們常有一些具體的實(shí)操疑問(wèn)。本文收集了個(gè)最具代表性的問(wèn)題,并結(jié)合東亞合成IXE系列的產(chǎn)品特性,給出清晰的技術(shù)解答,為您掃清應(yīng)用障礙。
    的頭像 發(fā)表于 12-08 16:38 ?346次閱讀
    <b class='flag-5'>工程</b>師實(shí)戰(zhàn)指南:關(guān)于離子捕捉劑應(yīng)用的<b class='flag-5'>五</b><b class='flag-5'>個(gè)</b>關(guān)鍵問(wèn)題與解答

    自動(dòng)駕駛中常提的“強(qiáng)化學(xué)習(xí)”是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號(hào)]在談及自動(dòng)駕駛時(shí),有些方案中會(huì)提到“強(qiáng)化學(xué)習(xí)(Reinforcement Learning,簡(jiǎn)稱RL)”,強(qiáng)化學(xué)習(xí)是一類(lèi)讓機(jī)器通過(guò)試錯(cuò)來(lái)學(xué)會(huì)做決策的技術(shù)。簡(jiǎn)單理解
    的頭像 發(fā)表于 10-23 09:00 ?690次閱讀
    自動(dòng)駕駛中常提的“強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>”是<b class='flag-5'>個(gè)</b>啥?

    大電磁頻譜管理監(jiān)測(cè)系統(tǒng)軟件:有哪些優(yōu)點(diǎn)和缺點(diǎn)

    大電磁頻譜管理監(jiān)測(cè)系統(tǒng)軟件:有哪些優(yōu)點(diǎn)和缺點(diǎn)
    的頭像 發(fā)表于 09-28 16:50 ?837次閱讀
    <b class='flag-5'>五</b>大電磁頻譜管理監(jiān)測(cè)系統(tǒng)軟件:有哪些<b class='flag-5'>優(yōu)點(diǎn)</b>和缺點(diǎn)

    大海上安全事件應(yīng)急處置系統(tǒng):有哪些優(yōu)點(diǎn)和缺點(diǎn)

    大海上安全事件應(yīng)急處置系統(tǒng):有哪些優(yōu)點(diǎn)和缺點(diǎn)
    的頭像 發(fā)表于 09-04 17:09 ?1039次閱讀
    <b class='flag-5'>五</b>大海上安全事件應(yīng)急處置系統(tǒng):有哪些<b class='flag-5'>優(yōu)點(diǎn)</b>和缺點(diǎn)

    【Sipeed MaixCAM Pro開(kāi)發(fā)板試用體驗(yàn)】 + 04 + 機(jī)器學(xué)習(xí)YOLO體驗(yàn)

    、 機(jī)器學(xué)習(xí)YOLO體驗(yàn) 1.在線訓(xùn)練 Sipeed矽速科技擁有自研搭建的MaixHub平臺(tái),可以快速簡(jiǎn)單的完成yolo訓(xùn)練。 下面我將展示訓(xùn)練集拍攝標(biāo)注和訓(xùn)練的相關(guān)圖片 數(shù)據(jù)集有直接上傳和拍攝2種
    發(fā)表于 07-24 21:35

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    ,越來(lái)越多地被應(yīng)用于機(jī)器學(xué)習(xí)任務(wù)中。本文將探討 FPGA 在機(jī)器學(xué)習(xí)中的應(yīng)用,特別是在加速神經(jīng)網(wǎng)絡(luò)推理、優(yōu)化算法和提升處理效率方面的優(yōu)勢(shì)。
    的頭像 發(fā)表于 07-16 15:34 ?2904次閱讀

    電子硬件工程師如何從零開(kāi)始學(xué)習(xí)?(文末免費(fèi)分享從零開(kāi)始學(xué)習(xí)資料)

    經(jīng)常有用戶咨詢,如何學(xué)習(xí)和提升電子硬件能力,有沒(méi)有適合小白學(xué)習(xí)的資料等等;電子硬件工程師是一個(gè)結(jié)合理論、實(shí)踐和創(chuàng)新能力的職業(yè),需要掌握電路設(shè)計(jì)、元器件選型、PCB設(shè)計(jì)、嵌入式系統(tǒng)、測(cè)試
    的頭像 發(fā)表于 06-04 07:36 ?2212次閱讀
    電子硬件<b class='flag-5'>工程</b>師如何從零開(kāi)始<b class='flag-5'>學(xué)習(xí)</b>?(文末免費(fèi)分享從零開(kāi)始<b class='flag-5'>學(xué)習(xí)</b>資料)

    玻璃通孔技術(shù)的個(gè)獨(dú)特優(yōu)勢(shì)

    TGV(Through Glass Via)工藝之所以選擇在玻璃上打孔,主要是因?yàn)椴Aг谝韵?b class='flag-5'>五個(gè)方面相較于硅具有獨(dú)特優(yōu)勢(shì)。
    的頭像 發(fā)表于 05-23 16:32 ?1113次閱讀
    玻璃通孔技術(shù)的<b class='flag-5'>五</b><b class='flag-5'>個(gè)</b>獨(dú)特優(yōu)勢(shì)

    SOLIDWORKS教育版——全方面學(xué)習(xí)資源與教程

    功能,更以其全方面學(xué)習(xí)資源與教程,為學(xué)生構(gòu)建了一個(gè)從理論到實(shí)踐、從基礎(chǔ)到進(jìn)階的完整學(xué)習(xí)體系。本文將深入探討SOLIDWORKS教育版如何憑借其豐富的
    的頭像 發(fā)表于 04-23 11:03 ?890次閱讀
    SOLIDWORKS教育版——全<b class='flag-5'>方面</b>的<b class='flag-5'>學(xué)習(xí)</b>資源與教程

    機(jī)器視覺(jué)系統(tǒng)中如何評(píng)價(jià)光源的好壞

    從對(duì)比度、魯棒性、亮度、均勻性和可維護(hù)性個(gè)方面探討了光源在機(jī)器視覺(jué)系統(tǒng)中的重要性。
    的頭像 發(fā)表于 04-14 13:38 ?682次閱讀

    面向AI與機(jī)器學(xué)習(xí)應(yīng)用的開(kāi)發(fā)平臺(tái) AMD/Xilinx Versal? AI Edge VEK280

    AMD/Xilinx Versal? AI Edge VEK280評(píng)估套件是一款面向AI與機(jī)器學(xué)習(xí)應(yīng)用的開(kāi)發(fā)平臺(tái),專為邊緣計(jì)算場(chǎng)景優(yōu)化設(shè)計(jì)。以下從核心配置、技術(shù)特性、應(yīng)用場(chǎng)景及開(kāi)發(fā)支持等方面進(jìn)行詳細(xì)
    的頭像 發(fā)表于 04-11 18:33 ?2464次閱讀
    面向AI與<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>應(yīng)用的開(kāi)發(fā)平臺(tái) AMD/Xilinx Versal? AI Edge VEK280