91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

淺談物聯(lián)網(wǎng)機器學習的挑戰(zhàn)與機遇

5RJg_mcuworld ? 來源:未知 ? 2018-11-28 10:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據(jù)研究報告到2020年,將有超過200億臺互聯(lián)網(wǎng)連接設備投入使用,這些設備每年將產(chǎn)生超過500個zettabytes的數(shù)據(jù),隨著更多的技術進步,這個數(shù)字預計將繼續(xù)大幅增加。對于已經(jīng)投資物聯(lián)網(wǎng)的70%以上的組織而言,所有這些數(shù)據(jù)自然代表了獨特的競爭優(yōu)勢,并且獲得了用于開發(fā)創(chuàng)新AI應用程序的寶貴信息和見解的巨大機會。

事實證明,對于數(shù)據(jù)科學家和機器學習工程師而言,物聯(lián)網(wǎng)數(shù)據(jù)與商業(yè)領袖一樣令人興奮。從醫(yī)療保健和農(nóng)業(yè)到教育和運輸,物聯(lián)網(wǎng)蓬勃發(fā)展的領域與其應用程序一樣多樣化,從發(fā)現(xiàn)新信息到?jīng)Q策控制。物聯(lián)網(wǎng)數(shù)據(jù)科學為創(chuàng)建令人興奮的新數(shù)據(jù)產(chǎn)品打開了大門。但是,我們將在本文中研究物聯(lián)網(wǎng)數(shù)據(jù)科學的一些特殊性。

數(shù)據(jù)注意事項

正如我們所看到的,物聯(lián)網(wǎng)構成了新數(shù)據(jù)的最大來源之一。物聯(lián)網(wǎng)數(shù)據(jù)實際上可能被視為大數(shù)據(jù)的縮影。如果我們查看通過一個設備生成的數(shù)據(jù),我們通常會處理相當少量的數(shù)據(jù)(即使這也正在改變)。然而,隨著無數(shù)分布式設備生成連續(xù)的數(shù)據(jù)流,物聯(lián)網(wǎng)產(chǎn)生了大量的數(shù)據(jù)。它的多樣性同樣令人印象深刻:物聯(lián)網(wǎng)設備收集各種類型的信息,從音頻傳感器數(shù)據(jù),并且總體上負責數(shù)據(jù)格式多樣性的奇妙爆發(fā)。因為這些設備靠近用戶并不斷收集信息,這個生成的數(shù)據(jù)通常是高速的; 這使得物聯(lián)網(wǎng)數(shù)據(jù)特別適合時間序列建模。

但是物聯(lián)網(wǎng)數(shù)據(jù)也有一些獨特的方面,使得它的開發(fā)極具挑戰(zhàn)性。由于在采集和傳輸過程中發(fā)生錯誤,因此通常會產(chǎn)生噪聲。這使得構建,清理和驗證數(shù)據(jù)的過程成為機器學習算法開發(fā)中的關鍵步驟。從本質(zhì)上講,物聯(lián)網(wǎng)數(shù)據(jù)也是高度可變的,這是因為各種數(shù)據(jù)收集組件之間的數(shù)據(jù)流存在巨大的不一致,并且由于存在時間模式。不僅如此,數(shù)據(jù)本身的價值高度依賴于底層機制,捕獲數(shù)據(jù)的頻率以及處理數(shù)據(jù)的方式。即使來自特定設備的數(shù)據(jù)被認為是值得信賴的,我們?nèi)匀恍枰紤]到即使在類似條件下不同設備可能表現(xiàn)不同的事實。因此,在收集訓練數(shù)據(jù)時捕獲所有可能的情況在實踐中是不可行的。

半監(jiān)督學習

然而,物聯(lián)網(wǎng)數(shù)據(jù)最顯著的特征之一在于它的粗糙:因為物聯(lián)網(wǎng)設備通過各種復雜的傳感器收集數(shù)據(jù),它們生成的數(shù)據(jù)通常非常原始。這意味著在提取業(yè)務價值并構建強大的AI應用程序之前,必須進行大量數(shù)據(jù)處理。事實上,在構建智能物聯(lián)網(wǎng)應用程序時,將有意義的信號與噪聲分離并將這些非結(jié)構化數(shù)據(jù)流轉(zhuǎn)換為有用的結(jié)構化數(shù)據(jù)是最重要但危險的步驟。

大量的物聯(lián)網(wǎng)應用需要使用有監(jiān)督的機器學習,這是一類機器學習算法,需要在訓練模型之前標記數(shù)據(jù)。由于手動標記大型數(shù)據(jù)集是一項耗時,容易出錯且可能成本高昂的任務,因此機器學習專業(yè)人員通常會先著手標記的開源數(shù)據(jù)集開始,或者從少量數(shù)據(jù)開始標記。然而,物聯(lián)網(wǎng)數(shù)據(jù)的困難來自于它的特殊性:因為這些數(shù)據(jù)通常是獨一無二的,所以不能保證現(xiàn)有的開源數(shù)據(jù)集是隨時可用的,因此工程師必須標記自己的數(shù)據(jù)。

但是,由于物聯(lián)網(wǎng)數(shù)據(jù)的可變性,標記一個小的隨機樣本可能是不夠的??紤]到這一點,這些是在監(jiān)督算法訓練中利用標記和未標記數(shù)據(jù)的半監(jiān)督學習策略的完美環(huán)境。特別是主動學習,其中允許算法向群眾工作者查詢在訓練時智能選擇的訓練實例的子集的標簽,這是非常適合的方法,允許機器學習科學家獲得類似的算法精度。標簽成本的一小部分。

人群傳感

在機器學習方面,物聯(lián)網(wǎng)發(fā)展的一個非常有趣的方面是人群感知的出現(xiàn)。群體感知存在兩種不同的形式:自愿,當用戶自愿提供信息時,以及機會主義,當沒有明確的用戶干預時自動收集數(shù)據(jù)。這是物聯(lián)網(wǎng)數(shù)據(jù)不僅可以為物聯(lián)網(wǎng)應用的開發(fā)或改進做出貢獻的一種方式,而且還可以用作其他非物聯(lián)網(wǎng)應用的輸入。

物聯(lián)網(wǎng)實際上允許以前所未有的方式收集非常獨特的數(shù)據(jù)集。因為每個設備生成的數(shù)據(jù)通常是人為的,所以用戶可以標記或驗證它。

模型開發(fā)

如今,人工智能取得令人矚目的進步背后的主要因素之一是出現(xiàn)了更好的技術,例如GPU,可以實現(xiàn)更快的數(shù)據(jù)處理。物聯(lián)網(wǎng)的機器學習帶來了一個有趣的難題:雖然最好的模型需要接受大量數(shù)據(jù)的培訓,但大多數(shù)物聯(lián)網(wǎng)設備仍然受限于存儲空間和處理能力。出于這個原因,安全有效地將大量數(shù)據(jù)從設備傳輸?shù)椒掌骰蛟?,反之亦然,這是開發(fā)AI應用程序的關鍵。在云計算時代,一種自然的解決方案是將數(shù)據(jù)導出到開發(fā)模型的云中,并在模型準備好使用后將模型導出回設備。這特別有吸引力,特別是因為預計到2021年,所有生成的數(shù)據(jù)中有94%將在云中處理,這意味著它也可以利用其他數(shù)據(jù)源,無論是歷史數(shù)據(jù)還是源自其他物聯(lián)網(wǎng)設備。然而,將復雜模型存儲回存儲器受限的設備本身就是一個挑戰(zhàn),因為具有大量參數(shù)的復雜模型(例如深度學習模型)本身通常非常大。另一方面,在用于推理步驟的從設備向云上的模型發(fā)送數(shù)據(jù)的解決方案也可能是次優(yōu)的,尤其是在延遲需要非常低的情況下。將復雜模型存儲回存儲器受限的設備本身就是一個挑戰(zhàn),因為具有大量參數(shù)的復雜模型(例如深度學習模型)本身通常非常大。另一方面,在用于推理步驟的從設備向云上的模型發(fā)送數(shù)據(jù)的解決方案也可能是次優(yōu)的,尤其是在延遲需要非常低的情況下。將復雜模型存儲回存儲器受限的設備本身就是一個挑戰(zhàn),因為具有大量參數(shù)的復雜模型(例如深度學習模型)本身通常非常大。

另一個挑戰(zhàn)來自于物聯(lián)網(wǎng)設備可能無法連續(xù)連接到云,因此可能需要一些本地參考數(shù)據(jù)進行離線處理,以及獨立運行的能力。這是邊緣計算架構變得有趣的地方,因為它使數(shù)據(jù)能夠在邊緣設備級別進行初始處理。當需要增強安全性時,這種方法特別有吸引力; 這也是有利的,因為這種邊緣設備能夠過濾數(shù)據(jù),降低噪聲并提高現(xiàn)場數(shù)據(jù)質(zhì)量。

不出所料,人工智能工程師一直在努力實現(xiàn)兩全其美,最終開發(fā)出霧計算,這是一個分散的計算基礎設施。在這種方法中,數(shù)據(jù),計算能力,存儲和應用程序以最合理的方式在設備和云之間分布,最終通過將它們更緊密地結(jié)合在一起來利用它們各自的優(yōu)勢。

轉(zhuǎn)學習

我們已經(jīng)看到物聯(lián)網(wǎng)設備能夠生成大數(shù)據(jù),但在實踐中,使用外部歷史數(shù)據(jù)集開發(fā)物聯(lián)網(wǎng)智能應用程序的情況并不少見。這意味著可以依賴于由多個IoT設備的集合(通常是跨多個用戶的相同類型的設備)生成的數(shù)據(jù),或者依賴于完全不同的數(shù)據(jù)源。應用程序越具體和獨特,現(xiàn)有數(shù)據(jù)集可用的可能性就越小 - 例如,當設備捕獲與開源圖像數(shù)據(jù)集沒有相似性的非常特定類型的圖像時就是這種情況比如Imagenet?。話雖如此,物聯(lián)網(wǎng)應用實際上是幾種現(xiàn)有現(xiàn)有模型的巧妙融合,這是很常見的。這使得轉(zhuǎn)移學習很好地適應了物聯(lián)網(wǎng)環(huán)境中智能應用的發(fā)展。

轉(zhuǎn)移學習范例包括在數(shù)據(jù)集上訓練模型(通常是金標準模型)并使用它來對另一個數(shù)據(jù)集進行推斷?;蛘?,可以使用在生成此模型期間計算的參數(shù)作為在實際數(shù)據(jù)集上訓練模型的起點,而不是將模型初始化為隨機值。在這種情況下,我們將原始模型稱為“預訓練”模型,我們對特定于應用程序的數(shù)據(jù)進行微調(diào)。這種方法可以將訓練階段加速幾個數(shù)量級。使用相同的范例,可以使用由最終用戶直接生成的數(shù)據(jù)來訓練一般模型,然后根據(jù)具體情況對其進行細化和優(yōu)化。

安全和隱私問題

由于互聯(lián)網(wǎng)連接設備技術通過提供物理和網(wǎng)絡世界之間的連接來擴展當前的互聯(lián)網(wǎng),因此它生成的數(shù)據(jù)非常通用,但也是導致嚴重隱私問題的原因。事實上,參與物聯(lián)網(wǎng)的大約50%的組織認為安全是物聯(lián)網(wǎng)部署的最大障礙??紤]到大約三分之二的物聯(lián)網(wǎng)設備在消費者領域,以及個人的一些共享數(shù)據(jù)是如何,很容易理解為什么。這些問題加上與頻繁數(shù)據(jù)傳輸?shù)皆粕系念A期風險相結(jié)合,解釋了用戶為何要求保護其數(shù)據(jù)的保證。

然而,當這些物聯(lián)網(wǎng)應用程序由“聯(lián)合”數(shù)據(jù)(即多個用戶生成的數(shù)據(jù))提供支持時,事情變得更加陰險:用戶數(shù)據(jù)不僅可以直接泄露,還可以通過旁道攻擊間接暴露,當惡意代理反向工程機器學習算法的輸出以推斷私人信息。由于這些原因,數(shù)據(jù)保護法明顯有必要與技術和應用程序本身一起發(fā)展。

物聯(lián)網(wǎng)機器學習是以人為本的機器學習

由于物聯(lián)網(wǎng)設備使互聯(lián)網(wǎng)更貼近用戶并觸及人類生活的各個方面,因此它們通常允許收集高度上下文和個人數(shù)據(jù)。物聯(lián)網(wǎng)數(shù)據(jù)敘述其用戶生活的故事,并使其比以往更容易理解用戶的需求,愿望,歷史和偏好。這使得物聯(lián)網(wǎng)數(shù)據(jù)成為構建根據(jù)用戶個性量身定制的個性化應用程序的完美數(shù)據(jù)。

而且,由于物聯(lián)網(wǎng)通過收集高度個性化的數(shù)據(jù)以及提供高度個性化的應用程序和服務而非常密切地觸及我們的生活,因此物聯(lián)網(wǎng)機器學習可以真正成為以人為本的機器學習。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:物聯(lián)網(wǎng)中的機器學習會有哪些挑戰(zhàn)和機遇?

文章出處:【微信號:mcuworld,微信公眾號:嵌入式資訊精選】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    聯(lián)網(wǎng)新手小白,求前輩推薦一款學習用開發(fā)板

    我是新手小白,想自學聯(lián)網(wǎng)和人工智能技術,希望前輩們能推薦一款適合進行初級到中級知識學習、實驗和項目開發(fā)的開發(fā)板兼顧性價比,包括具體的品牌和型號。
    發(fā)表于 12-25 18:44

    Lora基站在聯(lián)網(wǎng)應用的重要性

    Lora基站在聯(lián)網(wǎng)應用中具有重要的地位。首先,Lora基站可以實現(xiàn)對聯(lián)網(wǎng)設備的遠程監(jiān)測和控制,為聯(lián)
    發(fā)表于 12-03 07:09

    學習聯(lián)網(wǎng)怎么入門?

    隨著聯(lián)網(wǎng)技術的不斷發(fā)展,越來越多的人開始關注學習這一領域。但是對于初學者來說,聯(lián)網(wǎng)似乎是一個龐雜的概念,
    發(fā)表于 10-14 10:34

    學習聯(lián)網(wǎng)可以做什么工作?

    學習聯(lián)網(wǎng)專業(yè)后,你可以從事多種與聯(lián)網(wǎng)相關的工作。聯(lián)網(wǎng)
    發(fā)表于 10-11 16:40

    深度學習對工業(yè)聯(lián)網(wǎng)有哪些幫助

    深度學習作為人工智能的核心分支,通過模擬人腦神經(jīng)網(wǎng)絡的層級結(jié)構,能夠自動從海量工業(yè)數(shù)據(jù)中提取復雜特征,為工業(yè)聯(lián)網(wǎng)(IIoT)提供了從數(shù)據(jù)感知到智能決策的全鏈路升級能力。以下從技術賦能、場景突破
    的頭像 發(fā)表于 08-20 14:56 ?1034次閱讀

    請問什么是聯(lián)網(wǎng)智庫?

    什么是聯(lián)網(wǎng)智庫?
    發(fā)表于 08-07 06:45

    聯(lián)網(wǎng)藍牙模塊有哪些優(yōu)勢?

    隨著聯(lián)網(wǎng)技術的不斷發(fā)展,藍牙模塊作為聯(lián)網(wǎng)的重要組成部分,其應用越來越廣泛。那么,聯(lián)網(wǎng)藍牙模
    發(fā)表于 06-28 21:49

    聯(lián)網(wǎng)的應用范圍有哪些?

    聯(lián)網(wǎng),簡單來說,就是“萬相連的互聯(lián)網(wǎng)”。它以互聯(lián)網(wǎng)為基石,將用戶端延伸至物品與物品之間,實現(xiàn)信息的交換與通信。打個比方,你的智能手表能實
    發(fā)表于 06-16 16:01

    聯(lián)網(wǎng)未來發(fā)展趨勢如何?

    近年來,聯(lián)網(wǎng)行業(yè)以其驚人的增長速度和無限的潛力成為了全球科技界的焦點。它正在改變我們的生活方式、商業(yè)模式和社會運轉(zhuǎn)方式。那么,聯(lián)網(wǎng)行業(yè)的未來發(fā)展趨勢將會是怎樣的呢?讓我們一同探尋其
    發(fā)表于 06-09 15:25

    聯(lián)網(wǎng)工程師為什么要學Linux?

    聯(lián)網(wǎng)工程師需要掌握Linux的主要原因可以從技術生態(tài)、開發(fā)需求、行業(yè)應用及就業(yè)競爭力四個角度來分析: 一、技術生態(tài)與行業(yè)適配性 1)嵌入式開發(fā)的主流平臺 聯(lián)網(wǎng)設備往往基于嵌
    發(fā)表于 05-26 10:32

    一文淺談工業(yè)聯(lián)網(wǎng)是什么

    工業(yè)生產(chǎn)向數(shù)字化、智能化轉(zhuǎn)型。以下從定義、核心技術、應用場景、發(fā)展趨勢及挑戰(zhàn)五個維度展開解析: 一、定義與核心價值 工業(yè)聯(lián)網(wǎng)聯(lián)網(wǎng)技術為
    的頭像 發(fā)表于 05-20 17:32 ?1341次閱讀

    Nordic nRF54 系列芯片:開啟 AI 與聯(lián)網(wǎng)新時代?

    在科技飛速發(fā)展的今天,芯片技術的創(chuàng)新始終是推動行業(yè)進步的關鍵力量。Nordic 公司的 nRF54 系列芯片,正以其卓越的性能和獨特的設計,為 AI 機器學習聯(lián)網(wǎng)應用帶來前所未有的
    發(fā)表于 04-01 00:18

    蜂窩聯(lián)網(wǎng)怎么選

    的數(shù)據(jù)傳輸速率。有了蜂窩聯(lián)網(wǎng)技術,您就不必在功耗和數(shù)據(jù)傳輸速率之間做出妥協(xié),而是可以兩全其美。 終身成本:雖然某些 LPWAN 技術的前期成本可能看起來很吸引人,但評估整個生命周期的成本(部署
    發(fā)表于 03-17 11:46

    為什么選擇蜂窩聯(lián)網(wǎng)

    在為您的聯(lián)網(wǎng)(IoT)應用評估最合適的低功耗廣域網(wǎng)(LPWAN)技術時,除了考慮技術指標外,還必須考慮各種因素,因為技術指標本身可能與實際性能大相徑庭。與 LoRaWAN、Sigfox
    發(fā)表于 03-17 11:42

    板狀天線:智能時代下的挑戰(zhàn)機遇并存

    深圳安騰納天線|板狀天線:智能時代下的挑戰(zhàn)機遇并存
    的頭像 發(fā)表于 03-13 09:02 ?1256次閱讀