91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

關于物聯(lián)網(wǎng)數(shù)據(jù)科學的具體特征

SSDFans ? 來源:未知 ? 作者:李倩 ? 2018-07-10 17:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

根據(jù)Gartner公司的數(shù)據(jù),到2020年將會有200億臺網(wǎng)絡連接設備投入使用,這些設備每年將產(chǎn)生超過500 ZB(zettabytes)數(shù)據(jù),也就是需要5000億個1TB硬盤才能放下,隨著科技的進步,預計這一數(shù)字將繼續(xù)大幅增長。對于已經(jīng)進入物聯(lián)網(wǎng)行業(yè)的70%的組織來講,這些數(shù)據(jù)代表了其獨一無二的競爭優(yōu)勢。這些數(shù)據(jù)可以幫助企業(yè)獲得有價值的信息用于開發(fā)創(chuàng)新的AI應用程序,這對于企業(yè)來說是一個巨大的機會。

事實證明,物聯(lián)網(wǎng)數(shù)據(jù)令數(shù)據(jù)科學家、機器學習工程師和企業(yè)領導者一樣興奮。從醫(yī)療保健和農(nóng)業(yè)到教育和交通,蓬勃發(fā)展的物聯(lián)網(wǎng)領域和其他領域一樣是多元化的,涵蓋了新信息的發(fā)現(xiàn)和決策控制。物聯(lián)網(wǎng)數(shù)據(jù)科學打開了創(chuàng)造新數(shù)據(jù)產(chǎn)品的大門。本文將討論一些關于物聯(lián)網(wǎng)數(shù)據(jù)科學的具體特征。

數(shù)據(jù)注意事項

目前,物聯(lián)網(wǎng)成為了新數(shù)據(jù)的重要來源之一,物聯(lián)網(wǎng)數(shù)據(jù)或許可以被看做大數(shù)據(jù)的縮影。如果我們只看一臺設備產(chǎn)生的數(shù)據(jù),那么我們只需要處理很少的數(shù)據(jù)就可以了(即使這些數(shù)據(jù)也一直在變化)。但無數(shù)的分布式設備會產(chǎn)生連續(xù)的數(shù)據(jù)流,所以物聯(lián)網(wǎng)會產(chǎn)生大量的數(shù)據(jù)。物聯(lián)網(wǎng)設備可以收集從音頻傳感器數(shù)據(jù)等各種類型的信息,并全面覆蓋整體數(shù)據(jù)格式的多樣化。

但是物聯(lián)網(wǎng)數(shù)據(jù)也存在一些獨一無二的特性,使其開發(fā)具有挑戰(zhàn)性。由于采集和傳輸過程中出現(xiàn)錯誤往往會產(chǎn)生噪音,這使得構(gòu)建、清理和驗收數(shù)據(jù)的過程成為機器學習算法發(fā)揮的關鍵步驟。本質(zhì)上來講,物聯(lián)網(wǎng)數(shù)據(jù)也是高度可變的,這是因為跨各種數(shù)據(jù)收集組件的數(shù)據(jù)流中存在巨大的不一致性,而且存在時間模式。不僅如此,數(shù)據(jù)本身的價值在很大程度上取決于底層機制,數(shù)據(jù)捕獲的頻率以及處理方式。即使來自特定設備的數(shù)據(jù)被認為是值得信賴的,我們?nèi)孕枰紤]到即使在相似條件下不同設備的行為也可能不同。因此在收集培訓數(shù)據(jù)時捕捉所有可能的情景在實踐中是不可行的。

半監(jiān)督學習

然而,物聯(lián)網(wǎng)數(shù)據(jù)的一個最顯著的特征在于其粗糙性:因為物聯(lián)網(wǎng)設備通過各種復雜的傳感器收集數(shù)據(jù),所產(chǎn)生的數(shù)據(jù)通常非常原始。這意味著,在提取業(yè)務價值并構(gòu)建強大的AI應用程序之前,主要的數(shù)據(jù)處理是必要的。實際上,將有意義的信號從噪聲中分離出來并將這些非結(jié)構(gòu)化數(shù)據(jù)流轉(zhuǎn)化為有用的結(jié)構(gòu)化數(shù)據(jù),是構(gòu)建智能物聯(lián)網(wǎng)應用程序最重要的一步。

大量物聯(lián)網(wǎng)應用需要使用監(jiān)督機器學習,這是一類機器學習算法,需要在模型可以被訓練之前標記數(shù)據(jù)。由于手動標記大型數(shù)據(jù)集是一項耗時、容易出錯且價格昂貴的任務,因此機器學習專業(yè)人員通常首先轉(zhuǎn)向標記為開源的數(shù)據(jù)集,或者從少量數(shù)據(jù)開始標記。然而,物聯(lián)網(wǎng)數(shù)據(jù)的難點來自其特殊性:因為這些數(shù)據(jù)通常是獨一無二的,所以不能保證現(xiàn)有的開源數(shù)據(jù)集隨著可獲得,并且工程師們有必要標記他們自己的數(shù)據(jù)。這正是高品質(zhì),適應性強的眾包標簽平臺所能提供的幫助。

但是,歸因于物聯(lián)網(wǎng)數(shù)據(jù)的可變性,標記一個小的隨機樣本可能不夠。考慮到這一點,這些是在算法訓練中利用標記和未標記數(shù)據(jù)的半督查學習策略的完美環(huán)境。特別是主動學習是一種非常合適的方法,允許機器學習科學家獲得類似的算法精確度,其中算法被允許向群眾查詢智能選擇的訓練實例的子集的標簽,是標簽成本的一小部分。

群體感知

在機器學習方面,物聯(lián)網(wǎng)發(fā)展的一個非常有趣的方面是群體感知的出現(xiàn)。群體感知包括兩種形式:自愿的,當用戶自愿提供信息時,以及在沒有明確干預用戶的情況下自動收集數(shù)據(jù)。這是物聯(lián)網(wǎng)數(shù)據(jù)不僅可以促進物聯(lián)網(wǎng)應用程序的開發(fā)或改進的一種方式,而且還可以用作其他非物聯(lián)網(wǎng)應用程序的輸入。

物聯(lián)網(wǎng)實際上允許以前所未有的方式收集非常獨特的數(shù)據(jù)集。由于每個設備生成的數(shù)據(jù)通常都是人為的,因此用戶可以標記或驗證它。收集最接近用戶位置的數(shù)據(jù)也變得可能:這正是Google要求用戶拍攝他們正在用餐的餐廳的照片,或者回答關于便利設施的一些問題的目的。這是第一次可以以大數(shù)據(jù)規(guī)模收集人工生成的數(shù)據(jù)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:物聯(lián)網(wǎng)機器學習的機遇和挑戰(zhàn)

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    一篇文章帶你了解什么是聯(lián)網(wǎng)技術?

    和相關的通信協(xié)議,以確保數(shù)據(jù)的可靠傳輸和高效處理。 平臺層:也稱為中間件層,主要負責數(shù)據(jù)的存儲、處理和分析。包括數(shù)據(jù)存儲系統(tǒng)(如數(shù)據(jù)庫、數(shù)據(jù)
    發(fā)表于 02-09 16:58

    Lora基站在聯(lián)網(wǎng)應用的重要性

    聯(lián)網(wǎng)設備的遠程監(jiān)測和控制,提供可靠的網(wǎng)絡連接和管理,保障聯(lián)網(wǎng)設備的數(shù)據(jù)安全。隨著
    發(fā)表于 12-03 07:09

    芯源半導體在聯(lián)網(wǎng)設備中具體防護方案

    (一)數(shù)據(jù)傳輸安全防護方案? 在聯(lián)網(wǎng)設備與云端、其他設備進行數(shù)據(jù)傳輸時,芯源半導體安全芯片通過以下方式保障數(shù)據(jù)傳輸安全:?
    發(fā)表于 11-18 08:06

    學習聯(lián)網(wǎng)怎么入門?

    隨著聯(lián)網(wǎng)技術的不斷發(fā)展,越來越多的人開始關注學習這一領域。但是對于初學者來說,聯(lián)網(wǎng)似乎是一個龐雜的概念,學習起來很困難。因此,從哪里開始學習
    發(fā)表于 10-14 10:34

    學習聯(lián)網(wǎng)可以做什么工作?

    健康、智能制造等領域。以下是一些常見的職業(yè)方向: 聯(lián)網(wǎng)工程師:從事物聯(lián)網(wǎng)系統(tǒng)的設計、開發(fā)、測試、維護和升級等工作,包括傳感器、無線通信、云計算、大數(shù)據(jù)等技術的應用。   嵌入式軟件工
    發(fā)表于 10-11 16:40

    聯(lián)網(wǎng)數(shù)據(jù)中心是什么?有什么功能?

    三個維度展開分析: 一、定義:聯(lián)網(wǎng)數(shù)據(jù)中心的本質(zhì) 聯(lián)網(wǎng)數(shù)據(jù)中心是傳統(tǒng)
    的頭像 發(fā)表于 09-22 17:14 ?1093次閱讀

    數(shù)據(jù)中臺可以接入哪些聯(lián)網(wǎng)云平臺

    數(shù)據(jù)中臺作為企業(yè)數(shù)字化轉(zhuǎn)型的核心樞紐,能夠通過標準化接口、協(xié)議適配及數(shù)據(jù)治理能力,接入多種類型的聯(lián)網(wǎng)云平臺,實現(xiàn)設備數(shù)據(jù)采集、存儲、分析及
    的頭像 發(fā)表于 08-19 15:22 ?769次閱讀

    聯(lián)網(wǎng)數(shù)據(jù)中臺和聯(lián)網(wǎng)網(wǎng)關有什么區(qū)別

    聯(lián)網(wǎng)數(shù)據(jù)中臺與聯(lián)網(wǎng)網(wǎng)關在聯(lián)網(wǎng)架構(gòu)中扮演不同角色
    的頭像 發(fā)表于 08-15 14:40 ?689次閱讀

    請問什么是聯(lián)網(wǎng)智庫?

    什么是聯(lián)網(wǎng)智庫?
    發(fā)表于 08-07 06:45

    MQTT聯(lián)網(wǎng)數(shù)據(jù)解析的難點有哪些?

    MQTT聯(lián)網(wǎng)數(shù)據(jù)解析的難點主要源于聯(lián)網(wǎng)場景中設備的多樣性、數(shù)據(jù)的復雜性以及系統(tǒng)的高要求,
    的頭像 發(fā)表于 08-05 18:13 ?906次閱讀

    聯(lián)網(wǎng)藍牙模塊有哪些優(yōu)勢?

    隨著聯(lián)網(wǎng)技術的不斷發(fā)展,藍牙模塊作為聯(lián)網(wǎng)的重要組成部分,其應用越來越廣泛。那么,聯(lián)網(wǎng)藍牙模
    發(fā)表于 06-28 21:49

    聯(lián)網(wǎng)的應用范圍有哪些?

    與及時維護,提高醫(yī)院的運營效率。 農(nóng)業(yè)生產(chǎn):智慧農(nóng)業(yè)利用聯(lián)網(wǎng)實現(xiàn)精準種植與養(yǎng)殖。在農(nóng)業(yè)種植中,傳感器收集土壤濕度、養(yǎng)分含量、氣象等數(shù)據(jù),幫助農(nóng)民科學灌溉、施肥,提高農(nóng)作物產(chǎn)量與質(zhì)量。
    發(fā)表于 06-16 16:01

    聯(lián)網(wǎng)未來發(fā)展趨勢如何?

    :隨著聯(lián)網(wǎng)設備和傳感器的普及,數(shù)據(jù)安全和隱私保護將成為聯(lián)網(wǎng)行業(yè)發(fā)展的重要關注點。保護用戶數(shù)據(jù)
    發(fā)表于 06-09 15:25

    蜂窩聯(lián)網(wǎng)怎么選

    數(shù)據(jù)傳輸速率。有了蜂窩聯(lián)網(wǎng)技術,您就不必在功耗和數(shù)據(jù)傳輸速率之間做出妥協(xié),而是可以兩全其美。 終身成本:雖然某些 LPWAN 技術的前期成本可能看起來很吸引人,但評估整個生命周期的
    發(fā)表于 03-17 11:46

    為什么選擇蜂窩聯(lián)網(wǎng)

    的基礎設施。 數(shù)據(jù)傳輸速率和穩(wěn)健性: 由于 LPWAN 技術通常用于不頻繁發(fā)送/接收數(shù)據(jù)的設備,因此許多技術都針對這種使用情況進行了優(yōu)化。然而,某些操作(如遠程固件更新)需要更高的數(shù)據(jù)傳輸速率。這正是蜂窩
    發(fā)表于 03-17 11:42