91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如何選擇異常檢測算法

Dbwd_Imgtec ? 來源:DeepHub IMBA ? 作者:Dmytro Nikolaiev ? 2021-10-25 09:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

異常檢測(也稱為離群點檢測)是檢測異常實例的任務,異常實例與常規(guī)實例非常不同。這些實例稱為異?;螂x群值,而正常實例稱為內(nèi)部值。

異常檢測可用于多種應用,例如:

① 欺詐識別

② 檢測制造中的缺陷產(chǎn)品

③ 數(shù)據(jù)清理——在訓練另一個模型之前從數(shù)據(jù)集中去除異常值。

你可能已經(jīng)注意到,一些不平衡分類的問題也經(jīng)常使用異常檢測算法來解決。例如,垃圾郵件檢測任務可以被認為是一個分類任務(垃圾郵件比普通電子郵件少得多),但是我們可以用異常檢測的方法實現(xiàn)這個任務。

一個相關的任務是奇異值檢測(Novelty Detection)。它與異常檢測的不同之處在于,假設該算法是在干凈的數(shù)據(jù)集(沒有異常值)上訓練的。它被廣泛應用于在線學習中,當需要識別一個新實例是否是一個離群值時。

另一個相關任務是密度估計。它是估計數(shù)據(jù)集生成的隨機過程的概率密度函數(shù)的任務。密度估計通常用于異常檢測(位于低密度區(qū)域的實例很可能是異常)和數(shù)據(jù)分析。通常使用基于密度(高斯混合模型或 DBSCAN)的聚類算法來解決。

統(tǒng)計方法

檢測離群值最簡單的方法是嘗試統(tǒng)計方法,這是很久以前開發(fā)出來的。其中最流行的一種方法被稱為離群值檢測Tukey方法(或四分位數(shù)距離IQR) 。

它的本質是計算百分位數(shù)和四分位數(shù)之間的范圍。位于Q1-1.5 * IQR之前和Q3 + 1.5 * IQR之后的數(shù)據(jù)點被認為是異常值。下面你可以看到一個使用人的身高數(shù)據(jù)集的例子。高度低于54.95英寸(139厘米)和高于77.75英寸(197厘米)被認為是異常值。

這種和其他統(tǒng)計方法(用于檢測異常值的 z-score 方法等)通常用于數(shù)據(jù)清理。

聚類和降維算法

另一種簡單、直觀且通常有效的異常檢測方法是使用一些聚類算法(如高斯混合模型和 DBSCAN)來解決密度估計任務。那么,任何位于低密度區(qū)域的實例都可以被認為是異常,我們只需要設置一些密度閾值。

此外,可以使用任何具有 inverse_transform() 方法的降維算法。這是因為異常的重建誤差總是比正常實例的重建誤差大得多。

孤立森林和 SVM

一些監(jiān)督學習算法也可用于異常檢測,其中最流行的兩種是孤立森林和 SVM。這些算法更適合奇異值檢測,但通常也適用于異常檢測。

孤立森林算法構建了一個隨機森林,其中每個決策樹都是隨機生長的。每走一步,這片森林就會隔離越來越多的點,直到所有點都變得孤立。由于異常位于遠離通常數(shù)據(jù)點的位置,因此它們通常比正常實例以更少的步驟被孤立。該算法對于高維數(shù)據(jù)表現(xiàn)良好,但需要比 SVM 更大的數(shù)據(jù)集。

SVM(在我們的例子中是一類 SVM)也廣泛用于異常檢測。內(nèi)核化 SVM 可以構建一個有效的“限制超平面”,它將正常點與異常點分開。像任何 SVM 修改一樣,它可以很好地處理高維或稀疏數(shù)據(jù),但僅適用于中小型數(shù)據(jù)集。

局部異常因子

局部異常值因子 (LOF) 算法基于異常位于低密度區(qū)域的假設。它不只是設置密度閾值(就像我們可以用 DBSCAN 做的那樣),而是將某個點的密度與其最近鄰居的 k 的密度進行比較。如果這個特定點的密度比它的鄰點低得多(這意味著它離它們很遠),它被認為是一個異常。

該算法既可用于異常檢測,也可用于奇異值檢測。由于其計算簡單且質量好,會被經(jīng)常使用。

最小協(xié)方差行列式

最小協(xié)方差行列式(MCD 或其修改型 Fast-MCD)可用于異常值檢測,尤其是在數(shù)據(jù)清理的時候。它假設內(nèi)點是從單個高斯分布中生成的,而離群點不是從這個分布中生成的。由于許多數(shù)據(jù)具有正態(tài)分布(或可以簡化為正態(tài)分布),因此該算法通常表現(xiàn)良好。在 sklearn 中EllipticEnvelope類就是它的實現(xiàn)。

如何選擇異常檢測算法?

如果你需要清理數(shù)據(jù)集,你應該首先嘗試經(jīng)典的統(tǒng)計方法,比如 Tukey Method for Outlier Detection。如果知道數(shù)據(jù)分布是高斯分布 則可以使用Fast-MCD,。

如果你做異常檢測不是為了數(shù)據(jù)清理,首先試試簡單快速的LOF。如果它不能很好地工作(或者如果你出于某種原因需要分離超平面)——根據(jù)你的任務和數(shù)據(jù)集嘗試其他算法:

用于稀疏高維數(shù)據(jù)的單類SVM 或用于連續(xù)高維數(shù)據(jù)的孤立森林

如果可以假設數(shù)據(jù)是由多個高斯分布的混合生成的,可以試試高斯混合模型

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)

    關注

    8

    文章

    7335

    瀏覽量

    94760
  • 異常檢測
    +關注

    關注

    1

    文章

    45

    瀏覽量

    9997
  • 模型
    +關注

    關注

    1

    文章

    3752

    瀏覽量

    52101

原文標題:10分鐘掌握異常檢測

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    使用K-means算法進行異常偵測

    振動穩(wěn)定); 清空舊模型并重新開始學習過程。 3 代碼說明 3.1模型算法說明 模型采用簡單的 在線聚類 + 歐氏距離檢測算法: 1. 特征提?。? 2. 學習階段(update rule
    發(fā)表于 01-16 14:09

    Melexis推出針對FIR陣列的免費版人員檢測算法

    全球微電子工程公司Melexis宣布,重磅推出專為MLX90642(FIR) 32×24熱傳感器陣列設計的新型人員檢測算法,可實現(xiàn)人員檢測、精確計數(shù)以及位置定位。與傳統(tǒng)攝像頭相比,該解決方案在保護
    的頭像 發(fā)表于 12-15 17:30 ?500次閱讀

    機器視覺助力FPD 面板檢測

    FPD面板光學檢測,需要在工業(yè)相機上使用圖像識別和檢測算法檢測缺陷和異常
    的頭像 發(fā)表于 09-26 16:09 ?641次閱讀
    機器視覺助力FPD 面板<b class='flag-5'>檢測</b>

    有哪些常見的AI算法可以用于裝置數(shù)據(jù)的異常檢測?

    (如邊緣 / 云端)。以下按 算法類型分類 ,詳細介紹常見 AI 算法的原理、適用場景、優(yōu)缺點及裝置數(shù)據(jù)適配性: 一、無監(jiān)督式異常檢測算法(主流選擇
    的頭像 發(fā)表于 09-18 09:27 ?770次閱讀
    有哪些常見的AI<b class='flag-5'>算法</b>可以用于裝置數(shù)據(jù)的<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>?

    如何利用AI算法進行裝置數(shù)據(jù)的異常檢測?

    - 異常閉環(huán)” 的全流程設計,實現(xiàn)精準、高效的異常識別。以下是具體實施框架與關鍵步驟: 一、第一步:明確裝置數(shù)據(jù)異常類型與檢測目標 在選擇
    的頭像 發(fā)表于 09-05 15:27 ?1855次閱讀
    如何利用AI<b class='flag-5'>算法</b>進行裝置數(shù)據(jù)的<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>?

    IGBT 樣品異常檢測案例解析

    通過利用Thermal EMMI(熱紅外顯微鏡)去檢測IGBT 樣品異常
    的頭像 發(fā)表于 08-15 09:17 ?1894次閱讀
    IGBT 樣品<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>案例解析

    機器學習異常檢測實戰(zhàn):用Isolation Forest快速構建無標簽異常檢測系統(tǒng)

    算法進行異常檢測,并結合LightGBM作為主分類器,構建完整的欺詐檢測系統(tǒng)。文章詳細闡述了從無監(jiān)督異常
    的頭像 發(fā)表于 06-24 11:40 ?1410次閱讀
    機器學習<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>實戰(zhàn):用Isolation Forest快速構建無標簽<b class='flag-5'>異常</b><b class='flag-5'>檢測</b>系統(tǒng)

    基于RK3576開發(fā)板的車輛檢測算法

    車輛檢測是一種基于深度學習的對人進行檢測定位的目標檢測,能廣泛的用于園區(qū)管理、交通分析等多種場景,是違停識別、堵車識別、車流統(tǒng)計等多種算法的基石算法
    的頭像 發(fā)表于 05-08 17:34 ?1479次閱讀
    基于RK3576開發(fā)板的車輛<b class='flag-5'>檢測算法</b>

    基于RK3576開發(fā)板的安全帽檢測算法

    安全帽佩戴檢測是工地、生產(chǎn)安全、安防的重中之重,但人為主觀檢測的方式時效性差且不能全程監(jiān)控。AI技術的日漸成熟催生了安全帽佩戴檢測方案,成為了監(jiān)督佩戴安全帽的利器。本安全帽檢測算法是一
    的頭像 發(fā)表于 05-08 16:59 ?2011次閱讀
    基于RK3576開發(fā)板的安全帽<b class='flag-5'>檢測算法</b>

    基于RK3576開發(fā)板的人員檢測算法

    展示了RK3576開發(fā)板的人員檢測算法例程及API說明
    的頭像 發(fā)表于 05-07 17:33 ?876次閱讀
    基于RK3576開發(fā)板的人員<b class='flag-5'>檢測算法</b>

    基于RV1126開發(fā)板的車輛檢測算法開發(fā)

    車輛檢測是一種基于深度學習的對人進行檢測定位的目標檢測,能廣泛的用于園區(qū)管理、交通分析等多種場景,是違停識別、堵車識別、車流統(tǒng)計等多種算法的基石算法
    的頭像 發(fā)表于 04-14 16:00 ?859次閱讀
    基于RV1126開發(fā)板的車輛<b class='flag-5'>檢測算法</b>開發(fā)

    基于RV1126開發(fā)板的安全帽檢測算法開發(fā)

    安全帽佩戴檢測是工地、生產(chǎn)安全、安防的重中之重,但人為主觀檢測的方式時效性差且不能全程監(jiān)控。AI技術的日漸成熟催生了安全帽佩戴檢測方案,成為了監(jiān)督佩戴安全帽的利器。本安全帽檢測算法是一
    的頭像 發(fā)表于 04-14 15:10 ?845次閱讀
    基于RV1126開發(fā)板的安全帽<b class='flag-5'>檢測算法</b>開發(fā)

    基于RV1126開發(fā)板的人臉檢測算法開發(fā)

    在RV1126上開發(fā)人臉檢測算法組件
    的頭像 發(fā)表于 04-14 10:19 ?953次閱讀
    基于RV1126開發(fā)板的人臉<b class='flag-5'>檢測算法</b>開發(fā)

    軒轅智駕紅外目標檢測算法在汽車領域的應用

    在 AI 技術蓬勃發(fā)展的當下,目標檢測算法取得了重大突破,其中紅外目標檢測算法更是在汽車行業(yè)掀起了波瀾壯闊的變革,從根本上重塑著汽車的安全性能、駕駛體驗與產(chǎn)業(yè)生態(tài)。
    的頭像 發(fā)表于 03-27 15:55 ?953次閱讀

    睿創(chuàng)微納推出新一代目標檢測算法

    隨著AI技術的發(fā)展,目標檢測算法也迎來重大突破。睿創(chuàng)微納作為熱成像領軍者,憑借深厚的技術積累與創(chuàng)新能力,結合AI技術推出新一代目標檢測算法,以三大核心技術帶來AI視覺感知全場景解決方案突破,助力各產(chǎn)業(yè)智能化升級。
    的頭像 發(fā)表于 03-20 13:49 ?1144次閱讀