91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

探討機器學習在物聯(lián)網中的挑戰(zhàn)和機遇

Dbwd_Imgtec ? 來源:cg ? 2018-12-04 14:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據(jù)研究報告到2020年,將有超過200億臺互聯(lián)網連接設備投入使用,這些設備每年將產生超過500個zettabytes的數(shù)據(jù),隨著更多的技術進步,這個數(shù)字預計將繼續(xù)大幅增加。對于已經投資物聯(lián)網的70%以上的組織而言,所有這些數(shù)據(jù)自然代表了獨特的競爭優(yōu)勢,并且獲得了用于開發(fā)創(chuàng)新AI應用程序的寶貴信息和見解的巨大機會。

事實證明,對于數(shù)據(jù)科學家和機器學習工程師而言,物聯(lián)網數(shù)據(jù)與商業(yè)領袖一樣令人興奮。從醫(yī)療保健和農業(yè)到教育和運輸,物聯(lián)網蓬勃發(fā)展的領域與其應用程序一樣多樣化,從發(fā)現(xiàn)新信息到決策控制。物聯(lián)網數(shù)據(jù)科學為創(chuàng)建令人興奮的新數(shù)據(jù)產品打開了大門。但是,我們將在本文中研究物聯(lián)網數(shù)據(jù)科學的一些特殊性。

數(shù)據(jù)注意事項

正如我們所看到的,物聯(lián)網構成了新數(shù)據(jù)的最大來源之一。物聯(lián)網數(shù)據(jù)實際上可能被視為大數(shù)據(jù)的縮影。如果我們查看通過一個設備生成的數(shù)據(jù),我們通常會處理相當少量的數(shù)據(jù)(即使這也正在改變)。然而,隨著無數(shù)分布式設備生成連續(xù)的數(shù)據(jù)流,物聯(lián)網產生了大量的數(shù)據(jù)。它的多樣性同樣令人印象深刻:物聯(lián)網設備收集各種類型的信息,從音頻傳感器數(shù)據(jù),并且總體上負責數(shù)據(jù)格式多樣性的奇妙爆發(fā)。因為這些設備靠近用戶并不斷收集信息,這個生成的數(shù)據(jù)通常是高速的; 這使得物聯(lián)網數(shù)據(jù)特別適合時間序列建模。

但是物聯(lián)網數(shù)據(jù)也有一些獨特的方面,使得它的開發(fā)極具挑戰(zhàn)性。由于在采集和傳輸過程中發(fā)生錯誤,因此通常會產生噪聲。這使得構建,清理和驗證數(shù)據(jù)的過程成為機器學習算法開發(fā)中的關鍵步驟。從本質上講,物聯(lián)網數(shù)據(jù)也是高度可變的,這是因為各種數(shù)據(jù)收集組件之間的數(shù)據(jù)流存在巨大的不一致,并且由于存在時間模式。不僅如此,數(shù)據(jù)本身的價值高度依賴于底層機制,捕獲數(shù)據(jù)的頻率以及處理數(shù)據(jù)的方式。即使來自特定設備的數(shù)據(jù)被認為是值得信賴的,我們仍然需要考慮到即使在類似條件下不同設備可能表現(xiàn)不同的事實。因此,在收集訓練數(shù)據(jù)時捕獲所有可能的情況在實踐中是不可行的。

半監(jiān)督學習

然而,物聯(lián)網數(shù)據(jù)最顯著的特征之一在于它的粗糙:因為物聯(lián)網設備通過各種復雜的傳感器收集數(shù)據(jù),它們生成的數(shù)據(jù)通常非常原始。這意味著在提取業(yè)務價值并構建強大的AI應用程序之前,必須進行大量數(shù)據(jù)處理。事實上,在構建智能物聯(lián)網應用程序時,將有意義的信號與噪聲分離并將這些非結構化數(shù)據(jù)流轉換為有用的結構化數(shù)據(jù)是最重要但危險的步驟。

大量的物聯(lián)網應用需要使用有監(jiān)督的機器學習,這是一類機器學習算法,需要在訓練模型之前標記數(shù)據(jù)。由于手動標記大型數(shù)據(jù)集是一項耗時,容易出錯且可能成本高昂的任務,因此機器學習專業(yè)人員通常會先著手標記的開源數(shù)據(jù)集開始,或者從少量數(shù)據(jù)開始標記。然而,物聯(lián)網數(shù)據(jù)的困難來自于它的特殊性:因為這些數(shù)據(jù)通常是獨一無二的,所以不能保證現(xiàn)有的開源數(shù)據(jù)集是隨時可用的,因此工程師必須標記自己的數(shù)據(jù)。

但是,由于物聯(lián)網數(shù)據(jù)的可變性,標記一個小的隨機樣本可能是不夠的??紤]到這一點,這些是在監(jiān)督算法訓練中利用標記和未標記數(shù)據(jù)的半監(jiān)督學習策略的完美環(huán)境。特別是主動學習,其中允許算法向群眾工作者查詢在訓練時智能選擇的訓練實例的子集的標簽,這是非常適合的方法,允許機器學習科學家獲得類似的算法精度。標簽成本的一小部分。

人群傳感

在機器學習方面,物聯(lián)網發(fā)展的一個非常有趣的方面是人群感知的出現(xiàn)。群體感知存在兩種不同的形式:自愿,當用戶自愿提供信息時,以及機會主義,當沒有明確的用戶干預時自動收集數(shù)據(jù)。這是物聯(lián)網數(shù)據(jù)不僅可以為物聯(lián)網應用的開發(fā)或改進做出貢獻的一種方式,而且還可以用作其他非物聯(lián)網應用的輸入。

物聯(lián)網實際上允許以前所未有的方式收集非常獨特的數(shù)據(jù)集。因為每個設備生成的數(shù)據(jù)通常是人為的,所以用戶可以標記或驗證它。

模型開發(fā)

如今,人工智能取得令人矚目的進步背后的主要因素之一是出現(xiàn)了更好的技術,例如GPU,可以實現(xiàn)更快的數(shù)據(jù)處理。物聯(lián)網的機器學習帶來了一個有趣的難題:雖然最好的模型需要接受大量數(shù)據(jù)的培訓,但大多數(shù)物聯(lián)網設備仍然受限于存儲空間和處理能力。出于這個原因,安全有效地將大量數(shù)據(jù)從設備傳輸?shù)椒掌骰蛟?,反之亦然,這是開發(fā)AI應用程序的關鍵。在云計算時代,一種自然的解決方案是將數(shù)據(jù)導出到開發(fā)模型的云中,并在模型準備好使用后將模型導出回設備。這特別有吸引力,特別是因為預計到2021年,所有生成的數(shù)據(jù)中有94%將在云中處理,這意味著它也可以利用其他數(shù)據(jù)源,無論是歷史數(shù)據(jù)還是源自其他物聯(lián)網設備。另一方面,在用于推理步驟的從設備向云上的模型發(fā)送數(shù)據(jù)的解決方案也可能是次優(yōu)的,尤其是在延遲需要非常低的情況下。將復雜模型存儲回存儲器受限的設備本身就是一個挑戰(zhàn),因為具有大量參數(shù)的復雜模型(例如深度學習模型)本身通常非常大。

另一個挑戰(zhàn)來自于物聯(lián)網設備可能無法連續(xù)連接到云,因此可能需要一些本地參考數(shù)據(jù)進行離線處理,以及獨立運行的能力。這是邊緣計算架構變得有趣的地方,因為它使數(shù)據(jù)能夠在邊緣設備級別進行初始處理。當需要增強安全性時,這種方法特別有吸引力; 這也是有利的,因為這種邊緣設備能夠過濾數(shù)據(jù),降低噪聲并提高現(xiàn)場數(shù)據(jù)質量。

不出所料,人工智能工程師一直在努力實現(xiàn)兩全其美,最終開發(fā)出霧計算,這是一個分散的計算基礎設施。在這種方法中,數(shù)據(jù),計算能力,存儲和應用程序以最合理的方式在設備和云之間分布,最終通過將它們更緊密地結合在一起來利用它們各自的優(yōu)勢。

轉移學習

我們已經看到物聯(lián)網設備能夠生成大數(shù)據(jù),但在實踐中,使用外部歷史數(shù)據(jù)集開發(fā)物聯(lián)網智能應用程序的情況并不少見。這意味著可以依賴于由多個IoT設備的集合(通常是跨多個用戶的相同類型的設備)生成的數(shù)據(jù),或者依賴于完全不同的數(shù)據(jù)源。應用程序越具體和獨特,現(xiàn)有數(shù)據(jù)集可用的可能性就越小 - 例如,當設備捕獲與開源圖像數(shù)據(jù)集沒有相似性的非常特定類型的圖像時就是這種情況比如Imagenet?。話雖如此,物聯(lián)網應用實際上是幾種現(xiàn)有現(xiàn)有模型的巧妙融合,這是很常見的。這使得轉移學習很好地適應了物聯(lián)網環(huán)境中智能應用的發(fā)展。

轉移學習范例包括在數(shù)據(jù)集上訓練模型(通常是金標準模型)并使用它來對另一個數(shù)據(jù)集進行推斷?;蛘?,可以使用在生成此模型期間計算的參數(shù)作為在實際數(shù)據(jù)集上訓練模型的起點,而不是將模型初始化為隨機值。在這種情況下,我們將原始模型稱為“預訓練”模型,我們對特定于應用程序的數(shù)據(jù)進行微調。這種方法可以將訓練階段加速幾個數(shù)量級。使用相同的范例,可以使用由最終用戶直接生成的數(shù)據(jù)來訓練一般模型,然后根據(jù)具體情況對其進行細化和優(yōu)化。

安全和隱私問題

由于互聯(lián)網連接設備技術通過提供物理和網絡世界之間的連接來擴展當前的互聯(lián)網,因此它生成的數(shù)據(jù)非常通用,但也是導致嚴重隱私問題的原因。事實上,參與物聯(lián)網的大約50%的組織認為安全是物聯(lián)網部署的最大障礙。考慮到大約三分之二的物聯(lián)網設備在消費者領域,以及個人的一些共享數(shù)據(jù)是如何,很容易理解為什么。這些問題加上與頻繁數(shù)據(jù)傳輸?shù)皆粕系念A期風險相結合,解釋了用戶為何要求保護其數(shù)據(jù)的保證。

然而,當這些物聯(lián)網應用程序由“聯(lián)合”數(shù)據(jù)(即多個用戶生成的數(shù)據(jù))提供支持時,事情變得更加陰險:用戶數(shù)據(jù)不僅可以直接泄露,還可以通過旁道攻擊間接暴露,當惡意代理反向工程機器學習算法的輸出以推斷私人信息。由于這些原因,數(shù)據(jù)保護法明顯有必要與技術和應用程序本身一起發(fā)展。

物聯(lián)網機器學習是以人為本的機器學習

由于物聯(lián)網設備使互聯(lián)網更貼近用戶并觸及人類生活的各個方面,因此它們通常允許收集高度上下文和個人數(shù)據(jù)。物聯(lián)網數(shù)據(jù)敘述其用戶生活的故事,并使其比以往更容易理解用戶的需求,愿望,歷史和偏好。這使得物聯(lián)網數(shù)據(jù)成為構建根據(jù)用戶個性量身定制的個性化應用程序的完美數(shù)據(jù)。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 物聯(lián)網

    關注

    2946

    文章

    47853

    瀏覽量

    415513
  • 機器學習
    +關注

    關注

    66

    文章

    8556

    瀏覽量

    137005

原文標題:物聯(lián)網中機器學習的挑戰(zhàn)和機遇

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Lora基站在聯(lián)網應用的重要性

    Lora基站在聯(lián)網應用具有重要的地位。首先,Lora基站可以實現(xiàn)對聯(lián)網設備的遠程監(jiān)測和控制,為
    發(fā)表于 12-03 07:09

    芯源半導體聯(lián)網設備具體防護方案

    控制:結合設備身份認證結果,芯源半導體安全芯片支持細粒度的訪問控制。聯(lián)網系統(tǒng)可以根據(jù)設備的身份、權限等級等信息,限制設備對系統(tǒng)資源的訪問。例如,工業(yè)
    發(fā)表于 11-18 08:06

    GlobalData與華為探討AI對網絡基礎設施的機遇挑戰(zhàn)

    )與挑戰(zhàn)(滿足AI性能需求、網絡可靠性)。同時,指出AI自主網絡的作用以及L4 AN 于2025年商業(yè)啟動的相關布局建議,為運營商和企業(yè)提供指導。
    的頭像 發(fā)表于 10-14 14:24 ?617次閱讀

    學習聯(lián)網怎么入門?

    隨著聯(lián)網技術的不斷發(fā)展,越來越多的人開始關注學習這一領域。但是對于初學者來說,聯(lián)網似乎是一個龐雜的概念,
    發(fā)表于 10-14 10:34

    學習聯(lián)網可以做什么工作?

    學習聯(lián)網專業(yè)后,你可以從事多種與聯(lián)網相關的工作。聯(lián)網
    發(fā)表于 10-11 16:40

    Java 聯(lián)網與嵌入式系統(tǒng)的應用前景與挑戰(zhàn)

    的生態(tài)系統(tǒng)和強大的社區(qū)支持,Java 智能家居、工業(yè)控制、可穿戴設備等場景展現(xiàn)出獨特優(yōu)勢。本文將探討 Java 嵌入式與
    的頭像 發(fā)表于 09-04 14:49 ?1005次閱讀

    深度學習對工業(yè)聯(lián)網有哪些幫助

    、實施路徑三個維度展開分析: 一、深度學習如何突破工業(yè)聯(lián)網的技術瓶頸? 1. 非結構化數(shù)據(jù)處理:解鎖“沉睡數(shù)據(jù)”價值 傳統(tǒng)困境 :工業(yè)聯(lián)網
    的頭像 發(fā)表于 08-20 14:56 ?1049次閱讀

    FPGA機器學習的具體應用

    ,越來越多地被應用于機器學習任務。本文將探討 FPGA 機器
    的頭像 發(fā)表于 07-16 15:34 ?2914次閱讀

    聯(lián)網藍牙模塊有哪些優(yōu)勢?

    的續(xù)航時間。這對于需要長時間運行的聯(lián)網設備來說,是非常重要的一個優(yōu)勢。傳輸距離遠:相較于其他無線通信技術,藍牙模塊的傳輸距離較遠,可以100米以內的范圍內實現(xiàn)穩(wěn)定的通信。這使得其
    發(fā)表于 06-28 21:49

    聯(lián)網的應用范圍有哪些?

    的應用范圍極其廣泛,眾多行業(yè)都在積極引入這項技術,以提升效率、創(chuàng)新業(yè)務模式。 物流行業(yè):倉儲環(huán)節(jié),借助聯(lián)網技術,可實現(xiàn)對貨物的實時監(jiān)測,了解貨物的位置、狀態(tài)等信息,優(yōu)化倉儲空間布局。運輸過程
    發(fā)表于 06-16 16:01

    YAGEO與Pulse產品聯(lián)網設備的應用

    隨著聯(lián)網(IoT)技術的快速發(fā)展,設備之間的高效、可靠連接成為關鍵課題。聯(lián)網系統(tǒng),集成連
    的頭像 發(fā)表于 04-25 15:00 ?1161次閱讀

    Nordic nRF54 系列芯片:開啟 AI 與聯(lián)網新時代?

    科技飛速發(fā)展的今天,芯片技術的創(chuàng)新始終是推動行業(yè)進步的關鍵力量。Nordic 公司的 nRF54 系列芯片,正以其卓越的性能和獨特的設計,為 AI 機器學習
    發(fā)表于 04-01 00:18

    基于RK芯片的主板定制化:挑戰(zhàn)、機遇與發(fā)展趨勢

    隨著嵌入式系統(tǒng)和聯(lián)網技術的蓬勃發(fā)展,市場對于具備特定功能和性能的定制化主板需求日益增長。瑞芯微(Rockchip,簡稱RK)憑借其高性能、低功耗的芯片產品,平板電腦、電視盒子、人工智能等領域占據(jù)
    的頭像 發(fā)表于 03-27 14:50 ?1296次閱讀
    基于RK芯片的主板定制化:<b class='flag-5'>挑戰(zhàn)</b>、<b class='flag-5'>機遇</b>與發(fā)展趨勢

    蜂窩聯(lián)網怎么選

    的數(shù)據(jù)傳輸速率。有了蜂窩聯(lián)網技術,您就不必功耗和數(shù)據(jù)傳輸速率之間做出妥協(xié),而是可以兩全其美。 終身成本:雖然某些 LPWAN 技術的前期成本可能看起來很吸引人,但評估整個生命周期的成本(部署
    發(fā)表于 03-17 11:46

    為什么選擇蜂窩聯(lián)網

    、Wi-SUN 或其他 LPWAN 相比,蜂窩聯(lián)網(包括 NB-IoT 和 LTE-M)更適合您的聯(lián)網項目,以下是其中一些關鍵原因。 許可與非許可頻段: 蜂窩
    發(fā)表于 03-17 11:42