91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)分析學(xué)習(xí)的挑戰(zhàn):復(fù)雜性、不確定性及涌現(xiàn)性

454398 ? 來源:alpha007 ? 作者:alpha007 ? 2022-11-17 10:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:ST社區(qū)

科多分享的大數(shù)據(jù)分析學(xué)習(xí)與研究的新挑戰(zhàn):對于習(xí)慣結(jié)構(gòu)化數(shù)據(jù)研究的統(tǒng)計(jì)學(xué)來說,大數(shù)據(jù)分析顯然是一種嶄新的挑戰(zhàn)。

挑戰(zhàn)來自何方?來自于大數(shù)據(jù)的復(fù)雜性、不確定性和涌現(xiàn)性三個(gè)方面,其中復(fù)雜性最為根本。

大數(shù)據(jù)的復(fù)雜性

復(fù)雜性是大數(shù)據(jù)區(qū)別于傳統(tǒng)數(shù)據(jù)的根本所在,它主要表現(xiàn)為類型復(fù)雜性、結(jié)構(gòu)復(fù)雜性和內(nèi)在模式復(fù)雜性三個(gè)方面,從而使得大數(shù)據(jù)的存儲與分析產(chǎn)生多方面的困難。對于大數(shù)據(jù)的類型與結(jié)構(gòu)的復(fù)雜性這里不再贅述,但它們決定了數(shù)據(jù)模式的多樣化,使得刻畫數(shù)據(jù)特征的模式不斷變化、呈幾何級數(shù)增加。統(tǒng)計(jì)學(xué)盡管長期以來研究復(fù)雜現(xiàn)象的數(shù)量特征,但所涉及的數(shù)據(jù)是結(jié)構(gòu)化的,模式是固定化的,比起大數(shù)據(jù)要簡單得多。

因此,學(xué)習(xí)大數(shù)據(jù),我們不僅要熟悉各種類型的數(shù)據(jù)模式,還要善于把握它們之間的相互關(guān)系與作用,善于綜合利用各方面的知識(包括文本挖掘、圖像處理、信息網(wǎng)絡(luò)技術(shù)、心理學(xué)、社會學(xué)等等)加以研究。已有一些學(xué)者提出利用網(wǎng)絡(luò)來描述異質(zhì)數(shù)據(jù)間的關(guān)系,同時(shí)提出了目標(biāo)數(shù)據(jù)的“元路徑(Meta-Path)”概率刻畫模式。同時(shí),由于非結(jié)構(gòu)化數(shù)據(jù)通常比結(jié)構(gòu)化數(shù)據(jù)包含更多的無用信息和垃圾信息,因此需要運(yùn)用特定的方法來去偽存真、去粗存精,例如通過搜索引擎從非結(jié)構(gòu)化數(shù)據(jù)中檢索出有用的信息等等。

大數(shù)據(jù)的不確定性

網(wǎng)絡(luò)大數(shù)據(jù)通常是高維的,以往的統(tǒng)計(jì)學(xué)習(xí)方法往往難以產(chǎn)生令人滿意的效果。復(fù)雜性必然帶來不確定性。

大數(shù)據(jù)的不確定性表現(xiàn)為數(shù)據(jù)本身的不確定性、模型的不確定性和學(xué)習(xí)的不確定性,從而給大數(shù)據(jù)建模和學(xué)習(xí)造成困難。數(shù)據(jù)的不確定性既包括原始數(shù)據(jù)的不準(zhǔn)確,也包括數(shù)據(jù)處理過程中由各種因素所造成的在不同維度、不同尺度上的不確定性。例如阿里巴巴數(shù)據(jù)官曾經(jīng)介紹,區(qū)淘寶網(wǎng)上購物者的性別特征就可以有十幾種判斷。雖然傳統(tǒng)的統(tǒng)計(jì)學(xué)方法主要研究不確定性數(shù)據(jù),但傳統(tǒng)數(shù)據(jù)的不確定性明顯不同于大數(shù)據(jù)的不確定性,面對海量、高維、多類型的不確定性數(shù)據(jù),傳統(tǒng)的統(tǒng)計(jì)方法顯得力不從心,無論是數(shù)據(jù)的采集、存儲、建模還是查詢、檢索和挖掘,都需要創(chuàng)新方法。大數(shù)據(jù)的不確定性必然帶來數(shù)據(jù)處理與分析模型的不確定性,但要解決這一點(diǎn)非常困難,有人提出了“可能世界模型”,認(rèn)為應(yīng)該在一定的結(jié)構(gòu)規(guī)范下刻畫出數(shù)據(jù)的每一種狀態(tài),但這同樣極其困難,在實(shí)際應(yīng)用中不可能存在這樣一種通用的模型結(jié)構(gòu),只能采取簡化的模型,例如獨(dú)立性假設(shè)、同分布假設(shè)等等,尤其是概率圖模型已在數(shù)據(jù)相關(guān)性建模等方面得到了廣泛的應(yīng)用。

模型的不確定性又必然帶來大數(shù)據(jù)學(xué)習(xí)的不確定性,使得模型參數(shù)的學(xué)習(xí)很難找到最優(yōu)解,找到一個(gè)局部最優(yōu)解都很困難,通常只能采用近似的方法來替代。

隨著多核CPU/GPU的普及以及并行計(jì)算框架的研究,碎片化方法被普遍認(rèn)為是解決網(wǎng)絡(luò)大數(shù)據(jù)問題的可行方法,但需要做的工作仍然非常多。近些年來,統(tǒng)計(jì)學(xué)習(xí)領(lǐng)域的非參數(shù)模型方法提供了一種自動學(xué)習(xí)思路,但計(jì)算過程依然復(fù)雜,如何應(yīng)用到網(wǎng)絡(luò)大數(shù)據(jù)以及大數(shù)據(jù)培訓(xùn)中仍然是個(gè)問題。

大數(shù)據(jù)的涌現(xiàn)性

涌現(xiàn)性是網(wǎng)絡(luò)大數(shù)據(jù)有別于其他數(shù)據(jù)的關(guān)鍵特性,是大數(shù)據(jù)動態(tài)變化、擴(kuò)展、演化的結(jié)果,表現(xiàn)為模式的涌現(xiàn)性、行為的涌現(xiàn)性和智慧的涌現(xiàn)性,其在度量、研判與預(yù)測上的困難使得網(wǎng)絡(luò)數(shù)據(jù)難以被駕馭。

涌現(xiàn)性的背后是各種信息的交互作用,是產(chǎn)生新的人類行為方式、以及社會經(jīng)濟(jì)規(guī)律的重要基礎(chǔ)。模式的涌現(xiàn)性是指網(wǎng)絡(luò)數(shù)據(jù)由于多尺度、異質(zhì)性而表現(xiàn)出來的、在屬性和功能等方面既存在差異又相互關(guān)聯(lián)的特定模式特征,這種涌現(xiàn)性結(jié)果對于研究社會網(wǎng)絡(luò)模型、理解網(wǎng)絡(luò)瓦解原因具有重要意義。行為的涌現(xiàn)性則與數(shù)據(jù)的時(shí)序性有關(guān),是社會網(wǎng)絡(luò)中個(gè)體行為基于時(shí)序分布的統(tǒng)計(jì)結(jié)果,表現(xiàn)為較大相似性個(gè)體之間容易建立社會關(guān)系,使得網(wǎng)絡(luò)在演化過程中自發(fā)形成相互分離的連通塊。這種涌現(xiàn)性對于研究更多的社會網(wǎng)絡(luò)模型、理解行為涌現(xiàn)規(guī)律具有重要意義。例如,著名網(wǎng)絡(luò)科學(xué)家巴拉巴斯(Barabasi)通過研究發(fā)現(xiàn),人們發(fā)送郵件的數(shù)量存在著特定的時(shí)間分布特征。智慧的涌現(xiàn)性是指網(wǎng)絡(luò)數(shù)據(jù)在沒有全局控制和預(yù)先定義的情況下,來自大量個(gè)體的自發(fā)語義通過互相融合和連接可以形成為有特定意義的通用語義,整個(gè)過程隨著數(shù)據(jù)的變化而持續(xù)演進(jìn)。這種涌現(xiàn)性對于理解網(wǎng)絡(luò)語義的形成與變化具有重要意義。

總體而言,盡管近些年與大數(shù)據(jù)研究密切相關(guān)的數(shù)據(jù)庫、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和智能工程等領(lǐng)域都取得了很大的進(jìn)展,但由于大數(shù)據(jù)的復(fù)雜性、不確定性和涌現(xiàn)性,使得相關(guān)研究成果難以被直接應(yīng)用于學(xué)習(xí)大數(shù)據(jù)的分析研究之中。傳統(tǒng)的分析方法不能準(zhǔn)確表示網(wǎng)絡(luò)大數(shù)據(jù)在異構(gòu)性、交互性、時(shí)效性和突發(fā)性等方面的特點(diǎn),傳統(tǒng)的“假設(shè)—模型—驗(yàn)證”的統(tǒng)計(jì)方法受到了質(zhì)疑,而從“數(shù)據(jù)”到“數(shù)據(jù)”的第四研究范式還沒有真正建立,因此亟需一個(gè)新的理論體系來指導(dǎo),建立新的分析模型。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    9066

    瀏覽量

    143814
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    功率放大器在膠滴氣泡質(zhì)量與一致分析研究中的應(yīng)用

    不確定性流變特性、機(jī)電液耦合動力學(xué)及可靠評價(jià)的系統(tǒng)分析。本文通過區(qū)間過程模型、高保真耦合建模、可靠性分析及貝塞爾曲線優(yōu)化控制,結(jié)合理論/仿真/實(shí)驗(yàn),揭示膠粘劑分配性能演化規(guī)律,為高
    的頭像 發(fā)表于 03-06 11:18 ?82次閱讀
    功率放大器在膠滴氣泡質(zhì)量與一致<b class='flag-5'>性</b><b class='flag-5'>分析</b>研究中的應(yīng)用

    工業(yè)制造顛覆挑戰(zhàn)

    當(dāng)下AI以前所未有的觸角,滲透人類各生活場景,但在工作制造領(lǐng)域,因?yàn)楣I(yè)基礎(chǔ)模型的不確定性,AI仍處于止步不前的試探期,但豆包AI手機(jī)橫空出世,對工業(yè)AI的潛力仍不可小覷。以下來自《工業(yè)周刊》列舉
    的頭像 發(fā)表于 12-17 22:09 ?438次閱讀
    工業(yè)制造顛覆<b class='flag-5'>性</b><b class='flag-5'>挑戰(zhàn)</b>

    DP83826Ax:確定性、低延遲工業(yè)以太網(wǎng)PHY的深度解析

    DP83826Ax:確定性、低延遲工業(yè)以太網(wǎng)PHY的深度解析 在工業(yè)以太網(wǎng)領(lǐng)域,對于物理層收發(fā)器的性能要求愈發(fā)嚴(yán)苛,尤其是在實(shí)時(shí)、低延遲和低功耗等方面。DP83826Ax作為一款符合
    的頭像 發(fā)表于 12-15 15:20 ?418次閱讀

    渦輪部件多源不確定性機(jī)理與分類體系研究:從幾何變異到認(rèn)知局限的系統(tǒng)解析

    渦輪部件作為航空發(fā)動機(jī)和燃?xì)廨啓C(jī)的核心組成部分,其性能直接決定了整個(gè)動力系統(tǒng)的效率、可靠與壽命。在實(shí)際運(yùn)行環(huán)境中,渦輪部件的氣動與換熱性能往往與設(shè)計(jì)預(yù)期存在顯著差異,這種差異主要源于全壽命周期中存在的多源不確定性因素。
    的頭像 發(fā)表于 11-12 14:29 ?648次閱讀
    渦輪部件多源<b class='flag-5'>不確定性</b>機(jī)理與分類體系研究:從幾何變異到認(rèn)知局限的系統(tǒng)解析

    4種神經(jīng)網(wǎng)絡(luò)不確定性估計(jì)方法對比與代碼實(shí)現(xiàn)

    患者血壓,假設(shè)輸出是120/80這樣的正常值,表面看沒問題。但如果模型其實(shí)對這個(gè)預(yù)測很不確定呢?這時(shí)候光看數(shù)值就不夠了。神經(jīng)網(wǎng)絡(luò)有幾種方法可以在給出預(yù)測的同時(shí)估計(jì)不
    的頭像 發(fā)表于 11-10 10:41 ?502次閱讀
    4種神經(jīng)網(wǎng)絡(luò)<b class='flag-5'>不確定性</b>估計(jì)方法對比與代碼實(shí)現(xiàn)

    廣立微DE-G零斷檔重構(gòu)智能數(shù)據(jù)分析

    近日,數(shù)據(jù)分析領(lǐng)域被一則消息推上風(fēng)口浪尖:一家老牌軟件巨頭將撤出中國。在此背景下,其旗下以靈活著稱的數(shù)據(jù)分析軟件,在中國市場的未來將面臨極大的不確定性。
    的頭像 發(fā)表于 11-07 10:39 ?682次閱讀

    尋跡智行AMR融合RFID識別技術(shù),為柔性搬運(yùn)注入“確定性&quot;

    在智能物流與制造業(yè)不斷追求高效與柔性的今天,自主移動機(jī)器人(AMR)已成為革新場內(nèi)物流的核心力量。其“柔性”特質(zhì)——靈活部署、智能調(diào)度、自主避障——完美應(yīng)對了現(xiàn)代生產(chǎn)中的不確定性。
    的頭像 發(fā)表于 10-27 14:34 ?339次閱讀
    尋跡智行AMR融合RFID識別技術(shù),為柔性搬運(yùn)注入“<b class='flag-5'>確定性</b>&quot;

    從微秒級響應(yīng)到確定性延遲:深入解析米爾全志T536核心板的實(shí)時(shí)技術(shù)突破

    延遲、調(diào)度器抖動...這些因素導(dǎo)致Linux的延遲通常在幾十毫秒級別波動,根本無法滿足工業(yè)場景對確定性的苛刻要求。 一、工業(yè)實(shí)時(shí)挑戰(zhàn):從理論到實(shí)踐的鴻溝1.1 實(shí)時(shí)的分級標(biāo)準(zhǔn)在
    發(fā)表于 10-22 17:25

    深入解析米爾全志T536核心板的實(shí)時(shí)技術(shù)突破

    延遲、調(diào)度器抖動...這些因素導(dǎo)致Linux的延遲通常在幾十毫秒級別波動,根本無法滿足工業(yè)場景對確定性的苛刻要求。 一、工業(yè)實(shí)時(shí)挑戰(zhàn):從理論到實(shí)踐的鴻溝1.1 實(shí)時(shí)的分級標(biāo)準(zhǔn)在工業(yè)
    發(fā)表于 10-17 17:41

    醫(yī)療PCB供應(yīng)鏈復(fù)雜性與風(fēng)險(xiǎn)管控

    所談的PCB,可能涉及多層疊層結(jié)構(gòu)、多次鉆孔壓合工序,并需要通過大量認(rèn)證來滿足特定行業(yè)應(yīng)用標(biāo)準(zhǔn)。 這些復(fù)雜性僅僅是PCB供應(yīng)鏈宏觀概念中的一小部分。管理好常規(guī)PCB供應(yīng)鏈的風(fēng)險(xiǎn)已頗具挑戰(zhàn) – 當(dāng)PCB被應(yīng)用到關(guān)乎患者健康的醫(yī)療器械時(shí)
    的頭像 發(fā)表于 10-14 14:17 ?528次閱讀

    NVIDIA開源物理引擎與OpenUSD加速機(jī)器人學(xué)習(xí)

    開發(fā)能在工廠、醫(yī)院和公共空間與人類協(xié)同作業(yè)的機(jī)器人是一項(xiàng)巨大的技術(shù)挑戰(zhàn)。這類機(jī)器人需具備與人類接近的靈巧、感知能力、認(rèn)知能力和全身協(xié)調(diào)性,以便于實(shí)時(shí)應(yīng)對充滿不確定性的真實(shí)環(huán)境。
    的頭像 發(fā)表于 10-13 11:15 ?1013次閱讀

    電磁兼容與電磁干擾在電磁兼容大數(shù)據(jù)分析中的智能管理系統(tǒng)

    北京華盛恒輝電磁兼容 (EMC) 大數(shù)據(jù)智能管理系統(tǒng)精簡解析 在 EMC 大數(shù)據(jù)分析中,電磁兼容與電磁干擾(EMI)智能管理系統(tǒng)是保障設(shè)備穩(wěn)定、提升系統(tǒng)可靠的核心工具。系統(tǒng)整合 EMC/EMI
    的頭像 發(fā)表于 09-17 14:58 ?628次閱讀

    電磁兼容與電磁干擾在電磁兼容大數(shù)據(jù)分析中的智能管理平臺

    電磁兼容與電磁干擾在電磁兼容大數(shù)據(jù)分析中的智能管理系統(tǒng)
    的頭像 發(fā)表于 09-17 14:58 ?586次閱讀
    電磁兼容與電磁干擾在電磁兼容<b class='flag-5'>性</b><b class='flag-5'>大數(shù)據(jù)分析</b>中的智能管理平臺

    電磁兼容與電磁干擾在電磁兼容大數(shù)據(jù)分析中的智能管理系統(tǒng)

    電磁兼容與電磁干擾在電磁兼容大數(shù)據(jù)分析中的智能管理系統(tǒng)
    的頭像 發(fā)表于 09-17 14:42 ?875次閱讀
    電磁兼容與電磁干擾在電磁兼容<b class='flag-5'>性</b><b class='flag-5'>大數(shù)據(jù)分析</b>中的智能管理系統(tǒng)

    康謀分享 | 基于多傳感器數(shù)據(jù)的自動駕駛仿真確定性驗(yàn)證

    自動駕駛仿真測試中,游戲引擎的底層架構(gòu)可能會帶來非確定性的問題,侵蝕測試可信度。如何通過專業(yè)仿真平臺,在多傳感器配置與極端天氣場景中實(shí)現(xiàn)測試數(shù)據(jù)零差異?確定性驗(yàn)證方案已成為自動駕駛研發(fā)的關(guān)鍵突破口!
    的頭像 發(fā)表于 07-02 13:17 ?4273次閱讀
    康謀分享 | 基于多傳感器<b class='flag-5'>數(shù)據(jù)</b>的自動駕駛仿真<b class='flag-5'>確定性</b>驗(yàn)證