91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

KiloGram是一種用于管理文件中的大型n-gram的新算法

倩倩 ? 來(lái)源:互聯(lián)網(wǎng)分析沙龍 ? 2020-04-03 14:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近,一組研究人員在KiloGram上發(fā)表了他們的論文,KiloGram是一種用于管理文件中的大型n-gram的新算法,可以改善機(jī)器學(xué)習(xí)對(duì)惡意軟件的檢測(cè)能力。新算法比以前的方法快60倍,并且可以處理n = 1024或更高的n-gram。n的大值具有可解釋的惡意軟件分析和簽名生成的其他應(yīng)用程序。

在KDD 2019網(wǎng)絡(luò)安全學(xué)習(xí)和采礦研討會(huì)上發(fā)表的論文中,來(lái)自馬里蘭大學(xué)和網(wǎng)絡(luò)安全公司Endgame的研究人員描述了他們的算法,用于在大型文件數(shù)據(jù)集中查找最頻繁的n-gram。以前的方法在增加n的大小時(shí)會(huì)在內(nèi)存和運(yùn)行時(shí)中遇到“指數(shù)成本”,而在分析具有數(shù)十萬(wàn)個(gè)文件的數(shù)據(jù)集時(shí),它們的n值將小于8。相比之下,KiloGram算法能夠從數(shù)百萬(wàn)個(gè)文件中的5TB數(shù)據(jù)中提取n-gram,而僅使用9GB的RAM,并且“運(yùn)行時(shí)間不會(huì)隨n的增加而增加”。這允許算法為較大的n值提取n-gram,以測(cè)試這些n-gram是否為機(jī)器學(xué)習(xí)算法提供了更好的準(zhǔn)確性。

一個(gè)n-gram是n個(gè)項(xiàng)的唯一序列,并且該思想被用于許多機(jī)器學(xué)習(xí)任務(wù)中,尤其是自然語(yǔ)言處理(NLP)。在檢測(cè)到惡意軟件的情況下,n-gram是來(lái)自文件的字節(jié)序列,該文件將被分類為惡意軟件或良性文件。惡意軟件檢測(cè)的早期工作表明,較大的n-gram(例如n = 15或20)對(duì)于訓(xùn)練檢測(cè)系統(tǒng)是理想的,但是現(xiàn)代數(shù)據(jù)集的大小使得使用大于6的n值太昂貴。由于KiloGram算法可以處理那些較大的值,因此研究團(tuán)隊(duì)能夠測(cè)試較大值更好的想法。

該團(tuán)隊(duì)使用可執(zhí)行文件和Adobe PDF文檔的多個(gè)數(shù)據(jù)集,訓(xùn)練了Elastic-Net正則化邏輯回歸分類器來(lái)檢測(cè)惡意軟件;為了進(jìn)行回歸,輸入特征是使用KiloGram算法提取的n元語(yǔ)法。與文獻(xiàn)中的建議相反,研究人員發(fā)現(xiàn)“預(yù)測(cè)精度不會(huì)增加到n = 8以上”。較大的n-gram會(huì)產(chǎn)生精度降低的模型;但是,它們具有可解釋性的優(yōu)點(diǎn)。較小的n-gram產(chǎn)生“黑匣子”模型,而較大的n-gram特征集包含可能對(duì)分析人員有意義的字節(jié)序列。例如,它們可能代表代碼片段或文本字符串。

研究人員認(rèn)為,較大的n-gram在回歸模型中使用時(shí)不那么精確,因?yàn)樗鼈兏囟ㄓ谔囟ǖ膼阂廛浖?。?shí)際上,它們會(huì)導(dǎo)致過(guò)度擬合。但是,當(dāng)在諸如Yara之類的簽名模型中使用時(shí),它們的優(yōu)點(diǎn)是它們的假陽(yáng)性率低。也就是說(shuō),盡管Yara模型可能會(huì)錯(cuò)誤地將更多文件標(biāo)記為良性文件,但如果它確實(shí)表明文件為惡意軟件,則很少有錯(cuò)。這使得KiloGram算法可用于構(gòu)建結(jié)合了機(jī)器學(xué)習(xí)模型和基于簽名的模型的分層系統(tǒng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4789

    瀏覽量

    98395
  • 網(wǎng)絡(luò)安全
    +關(guān)注

    關(guān)注

    11

    文章

    3502

    瀏覽量

    63531
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8560

    瀏覽量

    137152
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    解析 NVTYS002N03CL:款高性能 N 溝道 MOSFET

    解析 NVTYS002N03CL:款高性能 N 溝道 MOSFET 在電子工程領(lǐng)域,MOSFET(金屬 - 氧化物 - 半導(dǎo)體場(chǎng)效應(yīng)晶體管)作為一種至關(guān)重要的功率器件,被廣泛應(yīng)
    的頭像 發(fā)表于 04-07 11:50 ?126次閱讀

    解析NVMFS6H864N款高性能單通道N溝道MOSFET

    解析NVMFS6H864N款高性能單通道N溝道MOSFET 在電子設(shè)計(jì)領(lǐng)域,MOSFET作為一種關(guān)鍵的功率半導(dǎo)體器件,廣泛應(yīng)用于各種電源
    的頭像 發(fā)表于 04-03 15:30 ?78次閱讀

    一種基于低噪聲電源管理架構(gòu)的射頻采樣系統(tǒng)設(shè)計(jì)方案

    本期為大家?guī)?lái)的是《雷達(dá)應(yīng)用射頻轉(zhuǎn)換器的無(wú)雜波電源(第 1 部分)》,介紹了一種基于低噪聲電源管理架構(gòu)的射頻采樣系統(tǒng)設(shè)計(jì)方案,以解決相控陣?yán)走_(dá)和 5G 通信應(yīng)用因開關(guān)電源噪聲耦合導(dǎo)
    的頭像 發(fā)表于 03-25 08:10 ?2005次閱讀
    <b class='flag-5'>一種</b>基于低噪聲電源<b class='flag-5'>管理</b>架構(gòu)的射頻采樣系統(tǒng)設(shè)計(jì)方案

    當(dāng)大型機(jī)械學(xué)會(huì)“感知”高壓:一種近電預(yù)警的技術(shù)實(shí)踐

    損毀。如何讓這些龐大的機(jī)械具備“感知”高壓的能力,成為電力安全領(lǐng)域的項(xiàng)重要課題。本文將對(duì)一種專門用于高壓線下作業(yè)的預(yù)警技術(shù)——吊車高壓防觸碰預(yù)警器進(jìn)行介紹。提示:
    的頭像 發(fā)表于 03-04 10:02 ?176次閱讀
    當(dāng)<b class='flag-5'>大型</b>機(jī)械學(xué)會(huì)“感知”高壓:<b class='flag-5'>一種</b>近電預(yù)警的技術(shù)實(shí)踐

    技術(shù)資訊 I 文詳解 STEP 文件

    本文要點(diǎn)STEP文件一種廣泛使用的中性文件格式,用于交換3D計(jì)算機(jī)輔助設(shè)計(jì)(CAD)數(shù)據(jù)。STEP文件分為多種類型,適
    的頭像 發(fā)表于 02-06 16:08 ?1116次閱讀
    技術(shù)資訊 I <b class='flag-5'>一</b>文詳解 STEP <b class='flag-5'>文件</b>

    一種無(wú)OS的MCU實(shí)用軟件框架

    介紹一種無(wú)OS的MCU實(shí)用軟件框架,包括任務(wù)輪詢管理,命令管理器、低功耗管理、環(huán)形緩沖區(qū)等實(shí)用模塊。系統(tǒng)中廣泛利用自定義段技術(shù)減少各個(gè)模塊間的耦合關(guān)系,大大提供程序的可維護(hù)性。 主要功
    發(fā)表于 01-08 06:58

    用于單片機(jī)幾種C語(yǔ)言算法

    算法的基本原理很簡(jiǎn)單,就是連續(xù)取N次采樣值后進(jìn)行算術(shù)平均。算法的程序代碼如下: 說(shuō)明:算術(shù)平均濾波算法用于對(duì)具有隨機(jī)干擾的信號(hào)進(jìn)行濾波
    發(fā)表于 11-27 06:00

    復(fù)雜的軟件算法硬件IP核的實(shí)現(xiàn)

    源代碼編譯為 HDL 的過(guò)程共分為兩步: (1)C to HASM (2)HASM to HDL 第步 C to HASM 是將 C 語(yǔ)言描述的算法編譯為一種中間的、與實(shí)際硬
    發(fā)表于 10-30 07:02

    國(guó)密系列算法簡(jiǎn)介及SM4算法原理介紹

    使用了Feistel結(jié)構(gòu)(分組密碼一種對(duì)稱結(jié)構(gòu)),其中密鑰擴(kuò)展部分也使用了Feistel結(jié)構(gòu),所以對(duì)數(shù)據(jù)和密鑰的處理流程極為相似。下面對(duì)SM4加密過(guò)程進(jìn)行闡述: 對(duì)于密鑰擴(kuò)展部分,采用固定參數(shù)FK
    發(fā)表于 10-24 08:25

    加密算法的應(yīng)用

    加密算法和非對(duì)稱加密算法兩類。 對(duì)稱加密是一種加密方式,也稱為共享密鑰加密。加密和解密使用同個(gè)密鑰。這種加密算法的優(yōu)點(diǎn)是加密和解密速度快,
    發(fā)表于 10-24 08:03

    一種高效智能的光伏電站管理平臺(tái)

    儲(chǔ)體化(集成多種儲(chǔ)能管理功能等)。用戶根據(jù)自身場(chǎng)景和需求,選擇合適光伏電站管理平臺(tái)及功能應(yīng)用配置,從而實(shí)現(xiàn)發(fā)電效率最大化、運(yùn)維成本最小化及碳中和目標(biāo)。 光伏電站管理平臺(tái)作為
    的頭像 發(fā)表于 07-18 09:20 ?1155次閱讀
    <b class='flag-5'>一種</b>高效智能的光伏電站<b class='flag-5'>管理</b>平臺(tái)

    100V15A點(diǎn)煙器N溝道MOS管HC070N10L

    N溝道MOS管(金屬-氧化物-半導(dǎo)體場(chǎng)效應(yīng)晶體管)是一種電壓控制型器件,依靠N型半導(dǎo)體的電子導(dǎo)電。當(dāng)柵極電壓超過(guò)閾值電壓時(shí),源極與漏極之間形成導(dǎo)電溝道,實(shí)現(xiàn)電流導(dǎo)通,具有輸入阻抗高、
    發(fā)表于 06-27 17:35

    在 KiCad 添加個(gè) AI 助手是一種什么體驗(yàn)?

    一種什么體驗(yàn)? 文章出處:【微信公眾號(hào):KiCad】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
    的頭像 發(fā)表于 05-15 14:28 ?1073次閱讀

    基于RK3576開發(fā)板的車輛檢測(cè)算法

    車輛檢測(cè)是一種基于深度學(xué)習(xí)的對(duì)人進(jìn)行檢測(cè)定位的目標(biāo)檢測(cè),能廣泛的用于園區(qū)管理、交通分析等多種場(chǎng)景,是違停識(shí)別、堵車識(shí)別、車流統(tǒng)計(jì)等多種算法的基石算法
    的頭像 發(fā)表于 05-08 17:34 ?1589次閱讀
    基于RK3576開發(fā)板的車輛檢測(cè)<b class='flag-5'>算法</b>

    AcrelCloud - 3200:大型商場(chǎng)預(yù)付費(fèi)管理的革新利器

    、方案概述 在現(xiàn)代商業(yè)運(yùn)營(yíng)和物業(yè)管理,大型商場(chǎng)、商業(yè)小區(qū)以及大集團(tuán)和大物業(yè)面臨著復(fù)雜的費(fèi)用收取和管理難題。安科瑞的 AcrelCloud
    的頭像 發(fā)表于 04-14 13:38 ?911次閱讀
    AcrelCloud - 3200:<b class='flag-5'>大型</b>商場(chǎng)預(yù)付費(fèi)<b class='flag-5'>管理</b>的革新利器