91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

簡(jiǎn)析特征抽取的經(jīng)典算法PCA

電子設(shè)計(jì) ? 來(lái)源:電子設(shè)計(jì) ? 作者:電子設(shè)計(jì) ? 2020-12-25 18:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

之前格物匯的文章給大家介紹過(guò),隨著近幾年大數(shù)據(jù)技術(shù)的普及,企業(yè)可以獲取海量數(shù)據(jù),但是這些海量數(shù)據(jù)帶給我們更多信息的同時(shí),也帶來(lái)了更多的噪音和異常數(shù)據(jù),如何降維去噪成為很多企業(yè)關(guān)注的焦點(diǎn)。而特征抽取和特征選擇都是降維的重要方法,針對(duì)于the curse of dimensionality(維數(shù)災(zāi)難),都可以達(dá)到降維的目的,但是這兩種方法有所不同。

特征抽?。‵eature Extraction)

Creatting a subset ofnew features by combinations of the exsiting features.也就是說(shuō),特征抽取后的新特征是原來(lái)特征的一個(gè)映射。

特征選擇(Feature Selection)

choosing a subset of allthe features(the ones more informative。也就是說(shuō),特征選擇后的特征是原來(lái)特征的一個(gè)子集。

特征抽取是如何對(duì)數(shù)據(jù)進(jìn)行變換的呢?其兩個(gè)經(jīng)典的方法:主成分分析(Principle Components Analysis ,PCA)和線性評(píng)判分析(LinearDiscriminant Analysis,LDA)給出了解答,今天我們就先來(lái)看一下什么是主成分分析。

什么是主成分分析

主成分分析(principal component analysis),PCA是其縮寫(xiě)。此方法是一種無(wú)監(jiān)督線性轉(zhuǎn)換技術(shù),其目標(biāo)是找到數(shù)據(jù)中最主要的元素和結(jié)構(gòu),去除噪音和冗余,將原有的復(fù)雜數(shù)據(jù)降維,揭露出隱藏在復(fù)雜數(shù)據(jù)背后的簡(jiǎn)單結(jié)構(gòu)。

主成分分析就是試圖在力保數(shù)據(jù)信息丟失最少的原則下,對(duì)這種多變量的數(shù)據(jù)表進(jìn)行最佳綜合簡(jiǎn)化。這些綜合指標(biāo)就稱(chēng)為主成分,也就是說(shuō),對(duì)高維變量空間進(jìn)行降維處理,從線性代數(shù)角度來(lái)看,PCA目標(biāo)是找到一組新正交基去重新描述得到的數(shù)據(jù)空間,這些新維度就是主成分。

PCA的原理

我們現(xiàn)在來(lái)看一下PCA算法是如何實(shí)現(xiàn)的,我們通過(guò)一個(gè)具體實(shí)例來(lái)理解,假設(shè)我們有這樣一些標(biāo)準(zhǔn)化后的數(shù)據(jù):[-1,-2],[-1,0],……,[2,1],[0,1]。我們寫(xiě)成向量的形式如下:

我們還可以在二維坐標(biāo)系中畫(huà)出來(lái):

PCA主要的目的是降維簡(jiǎn)化數(shù)據(jù),這些數(shù)據(jù)本就是二維,想要再降維則需要重新找一個(gè)方向,并把這些點(diǎn)映射到這個(gè)方向上(降到1維)。試想,怎么才能找到這個(gè)方向,且不損失大部分信息呢?PCA的做法是,找到新映射的方法需要滿足如下兩個(gè)原則:

1、在新映射的方向上每個(gè)數(shù)據(jù)的映射點(diǎn)方差盡可能大。因?yàn)榉讲畲蟮臄?shù)據(jù)所包含的信息量越大。

2、新映射的方向應(yīng)彼此正交,這樣映射出的坐標(biāo)點(diǎn)選取才更有意義。

尋找新映射也可以看作基變換,我們可以不斷旋轉(zhuǎn)基,尋找滿足上面兩個(gè)原則的情況。如下圖所示,中間的映射方向圖里數(shù)據(jù)在新基上映射點(diǎn)的方差就比右邊圖映射點(diǎn)方差大的多。而方差大則表示該數(shù)據(jù)在該方向上含有的信息量多,反之另一個(gè)新基的方向上含有的信息量就少的多。如果這個(gè)方向上的信息量非常少,即使舍去也無(wú)傷大雅,我們就可以考慮將其舍去,實(shí)現(xiàn)降維的操作。

新基可以看成是由以前標(biāo)準(zhǔn)直角坐標(biāo)系旋轉(zhuǎn)而成,在線性代數(shù)中,這樣的坐標(biāo)軸旋轉(zhuǎn)操作可以通過(guò)原本直角坐標(biāo)系坐標(biāo)乘轉(zhuǎn)換矩陣得到:

所以我們就將問(wèn)題轉(zhuǎn)換成找轉(zhuǎn)移矩陣W上,如何去求W呢?我們希望降維后的數(shù)據(jù)要盡可能的與原數(shù)據(jù)非常接近(不丟失信息)。我們可以計(jì)算轉(zhuǎn)換后的坐標(biāo)Z與轉(zhuǎn)換之前的坐標(biāo)X之間的距離:

因此為了讓轉(zhuǎn)換距離最小,我們可以將問(wèn)題等價(jià)轉(zhuǎn)換成:

由于中間推導(dǎo)過(guò)程較為復(fù)雜,故在此省略,最后求解推導(dǎo)的結(jié)果為:

這不正是特征值的定義公式嗎?所以只需要對(duì)協(xié)方差矩陣進(jìn)行特征值分解,并將求得的特征值排序,取前N(PCA所要降低的目標(biāo)維度)個(gè)特征值構(gòu)成的向量W,即為PCA的解。

PCA優(yōu)缺點(diǎn)

優(yōu)點(diǎn)

(1)它是無(wú)監(jiān)督學(xué)習(xí),只與數(shù)據(jù)相關(guān),無(wú)參數(shù)限制。

(2)通過(guò)PCA降維,可以達(dá)到簡(jiǎn)化模型和對(duì)數(shù)據(jù)進(jìn)行壓縮的效果。同時(shí)最大程度的保持了原有數(shù)據(jù)的信息。

(3)各主成分之間正交,可消除原始數(shù)據(jù)成分間的相互影響。

(4)計(jì)算方法簡(jiǎn)單,易于在計(jì)算機(jī)上實(shí)現(xiàn)。

缺點(diǎn)

(1)如果用戶(hù)對(duì)觀測(cè)對(duì)象有一定的先驗(yàn)知識(shí),掌握了數(shù)據(jù)的一些特征,卻無(wú)法通過(guò)參數(shù)化等方法對(duì)處理過(guò)程進(jìn)行干預(yù),可能會(huì)得不到預(yù)期的效果,效率也不高。

(2)貢獻(xiàn)率小的主成分往往可能含有對(duì)樣本差異的重要信息。

好了,今天格物匯的內(nèi)容就到這里,近期我們還將介紹特征抽取的另一種方法LDA(線性評(píng)判分析),敬請(qǐng)期待。

本文作者:格創(chuàng)東智OT團(tuán)隊(duì)(轉(zhuǎn)載請(qǐng)注明作者及來(lái)源)

審核編輯:符乾江
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    COSEL PCA系列AC - DC電源:醫(yī)療設(shè)備的理想之選

    COSEL PCA系列AC-DC電源:醫(yī)療設(shè)備的理想之選 在電子設(shè)備的設(shè)計(jì)中,電源供應(yīng)是至關(guān)重要的一環(huán),尤其是對(duì)于醫(yī)療電氣設(shè)備而言,對(duì)電源的穩(wěn)定性、安全性和性能有著極高的要求。今天,我們就來(lái)深入
    的頭像 發(fā)表于 03-27 12:20 ?143次閱讀

    算法工程師需要具備哪些技能?

    算法工程師需要掌握一系列跨學(xué)科的技能,涵蓋數(shù)學(xué)基礎(chǔ)、編程能力、算法理論、工程實(shí)踐以及業(yè)務(wù)理解等多個(gè)方面。 以下是具體技能及學(xué)習(xí)建議: 線性代數(shù)核心內(nèi)容:矩陣運(yùn)算、特征值分解、向量空間等。應(yīng)用場(chǎng)
    發(fā)表于 02-27 10:53

    探索PCA9547:8通道I2C總線復(fù)用器的設(shè)計(jì)奧秘

    探索PCA9547:8通道I2C總線復(fù)用器的設(shè)計(jì)奧秘 在電子設(shè)計(jì)領(lǐng)域,I2C總線是一種廣泛應(yīng)用的通信協(xié)議,而PCA9547作為一款8通道I2C總線復(fù)用器,為我們?cè)诙嘣O(shè)備通信中提供了強(qiáng)大的解決方案
    的頭像 發(fā)表于 02-26 17:45 ?1107次閱讀

    探索PCA9665/PCA9665A:Fm+并行總線到I2C總線控制器的深度解析

    探索PCA9665/PCA9665A:Fm+并行總線到I2C總線控制器的深度解析 在電子設(shè)計(jì)領(lǐng)域,總線控制器扮演著至關(guān)重要的角色,它能夠?qū)崿F(xiàn)不同類(lèi)型總線之間的通信,為系統(tǒng)的集成和擴(kuò)展提供了強(qiáng)大的支持
    的頭像 發(fā)表于 01-29 15:00 ?339次閱讀

    PID控制的算法

    當(dāng)中,PID控制算法又是最簡(jiǎn)單,最能體現(xiàn)反饋思想的控制算法,可謂經(jīng)典中的經(jīng)典。經(jīng)典的未必是復(fù)雜的,經(jīng)典
    發(fā)表于 01-23 08:18

    PCA9534APWR 具有中斷和配置寄存器的 8 位 2.3V 至 5.5V I2C/SMBus I/O 擴(kuò)展器

    /O擴(kuò)展器PCA9534APWR特征●低功耗設(shè)計(jì),待機(jī)電流最大值1μA,工作電壓2.3V-5.5V,I/O端口耐受5V電壓,適配多電壓系統(tǒng)●支持400kHz快速I(mǎi)
    的頭像 發(fā)表于 01-22 11:43 ?481次閱讀
    <b class='flag-5'>PCA</b>9534APWR   具有中斷和配置寄存器的 8 位 2.3V 至 5.5V I2C/SMBus I/O 擴(kuò)展器

    深入剖析PCA82C250 CAN控制器接口:性能、應(yīng)用與設(shè)計(jì)要點(diǎn)

    深入剖析PCA82C250 CAN控制器接口:性能、應(yīng)用與設(shè)計(jì)要點(diǎn) 在汽車(chē)電子以及工業(yè)自動(dòng)化等領(lǐng)域,控制器局域網(wǎng)(CAN)由于其可靠性、實(shí)時(shí)性和抗干擾能力,得到了廣泛應(yīng)用。而PCA82C250作為
    的頭像 發(fā)表于 12-30 16:30 ?627次閱讀

    PCA9545A:低電壓4通道I2C和SMBus開(kāi)關(guān)的深度解析

    PCA9545A:低電壓4通道I2C和SMBus開(kāi)關(guān)的深度解析 引言 在電子設(shè)計(jì)領(lǐng)域,I2C和SMBus接口的應(yīng)用極為廣泛。PCA9545A作為一款低電壓4通道I2C和SMBus開(kāi)關(guān),憑借其出色
    的頭像 發(fā)表于 12-29 09:30 ?482次閱讀

    PCA9548A:低電壓8通道I2C開(kāi)關(guān)的技術(shù)解析與應(yīng)用指南

    PCA9548A:低電壓8通道I2C開(kāi)關(guān)的技術(shù)解析與應(yīng)用指南 在電子設(shè)計(jì)領(lǐng)域,I2C總線的應(yīng)用極為廣泛,而PCA9548A作為一款低電壓8通道I2C開(kāi)關(guān),為解決I2C總線應(yīng)用中的諸多問(wèn)題提供了有效
    的頭像 發(fā)表于 12-27 09:45 ?1067次閱讀

    PCA9543A:2通道I2C總線開(kāi)關(guān)的深度解析與應(yīng)用指南

    PCA9543A:2通道I2C總線開(kāi)關(guān)的深度解析與應(yīng)用指南 在電子設(shè)計(jì)領(lǐng)域,I2C總線的應(yīng)用極為廣泛,而PCA9543A作為一款2通道I2C總線開(kāi)關(guān),憑借其獨(dú)特的性能和豐富的功能,在眾多應(yīng)用場(chǎng)景中發(fā)
    的頭像 發(fā)表于 12-26 11:30 ?572次閱讀

    探索PCA9955BTW - ARD評(píng)估板:開(kāi)啟LED驅(qū)動(dòng)設(shè)計(jì)新征程

    探索PCA9955BTW - ARD評(píng)估板:開(kāi)啟LED驅(qū)動(dòng)設(shè)計(jì)新征程 引言 在電子設(shè)計(jì)領(lǐng)域,LED驅(qū)動(dòng)的性能和靈活性至關(guān)重要。NXP Semiconductors推出的PCA
    的頭像 發(fā)表于 12-25 10:10 ?1216次閱讀

    PCA9617ADP - ARD評(píng)估板:功能、配置與使用指南

    PCA9617ADP - ARD評(píng)估板:功能、配置與使用指南 在電子設(shè)計(jì)領(lǐng)域,評(píng)估板是驗(yàn)證和開(kāi)發(fā)新器件的重要工具。今天,我們就來(lái)深入了解一下NXP Semiconductors推出
    的頭像 發(fā)表于 12-25 09:30 ?837次閱讀

    PCA9958HN - ARD評(píng)估板:24通道SPI總線LED驅(qū)動(dòng)評(píng)估利器

    PCA9958HN - ARD評(píng)估板:24通道SPI總線LED驅(qū)動(dòng)評(píng)估利器 在電子設(shè)計(jì)領(lǐng)域,LED驅(qū)動(dòng)的評(píng)估和設(shè)計(jì)是一個(gè)重要的環(huán)節(jié)。NXP的PCA9958HN - ARD評(píng)估板為工程師們提供了一個(gè)
    的頭像 發(fā)表于 12-24 11:50 ?736次閱讀

    簡(jiǎn)Modbus與MQTT的區(qū)別

    Modbus和MQTT是工業(yè)領(lǐng)域中兩種不同的通信協(xié)議,在設(shè)計(jì)目標(biāo)、應(yīng)用場(chǎng)景、通信模式等方面存在顯著差異,以下從多個(gè)維度簡(jiǎn)兩者的區(qū)別: 1.設(shè)計(jì)目標(biāo)與起源 Modbus 誕生于1979年,由施耐德
    的頭像 發(fā)表于 07-10 14:10 ?1145次閱讀

    PCA9958HN-ARD】GUI工具的使用

    一、說(shuō)明 PCA9958HN-ARD評(píng)估板是可以通過(guò)NXP官方的GUI上位機(jī)來(lái)進(jìn)行控制的,但是需要使用另外的官方指定的MCU開(kāi)發(fā)板。 例如下圖就是通過(guò)LPC55S69-EVKMCU板來(lái)演示
    發(fā)表于 06-29 10:07