91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)技術(shù)成為企業(yè)長遠(yuǎn)發(fā)展的驅(qū)動(dòng)力量?

我快閉嘴 ? 來源:精英數(shù)智科技股份有限公 ? 作者:侯宇輝 ? 2020-09-15 17:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在互聯(lián)網(wǎng)領(lǐng)域,大數(shù)據(jù)應(yīng)用十分廣泛,尤其以企業(yè)為主,企業(yè)作為大數(shù)據(jù)應(yīng)用的主體,數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)可視化、數(shù)據(jù)特征提取、數(shù)據(jù)特征選擇、數(shù)據(jù)清洗、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)倉庫、數(shù)據(jù)安全等圍繞大數(shù)據(jù)商業(yè)價(jià)值的利用焦點(diǎn)已備受關(guān)注。

一、數(shù)據(jù)采集

從數(shù)據(jù)采集層面來看,分為結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù),來源于物聯(lián)網(wǎng)的設(shè)備采集數(shù)據(jù)由于成本低、獲取方式容易,成為企業(yè)大數(shù)據(jù)采集數(shù)據(jù)的主要來源之一,實(shí)時(shí)性相對強(qiáng),數(shù)據(jù)量從GB、TB、PB、ZB級擴(kuò)增。然而對于中小企業(yè)或許會(huì)受困于沒有數(shù)據(jù)卻又想轉(zhuǎn)型通過搭建大數(shù)據(jù)平臺(tái)來提升競爭力,企業(yè)可以研發(fā)符合市場需求的產(chǎn)品,從新用戶、活躍用戶、粘性用戶到留存用戶,獲取用戶的行為數(shù)據(jù)之后可以進(jìn)行數(shù)據(jù)分析。此外數(shù)據(jù)采集可以有網(wǎng)絡(luò)爬蟲、ETL抽取等。

二、數(shù)據(jù)存儲(chǔ)

有了大量數(shù)據(jù)之后,對于數(shù)據(jù)存儲(chǔ)方式也提出了要求。數(shù)據(jù)存儲(chǔ)分為關(guān)系型數(shù)據(jù)庫存儲(chǔ)、分布式數(shù)據(jù)存儲(chǔ),數(shù)據(jù)級別較大時(shí)可以存儲(chǔ)在分布式文件存儲(chǔ)系統(tǒng)中。對于搭建大數(shù)據(jù)平臺(tái)的企業(yè)來說,通常是對業(yè)務(wù)結(jié)果的數(shù)據(jù)存儲(chǔ)于關(guān)系型系統(tǒng),對于TB級及以上數(shù)據(jù)量存儲(chǔ)至分布式系統(tǒng)中,這兩種數(shù)據(jù)可以使用Sqoop等類似的工具進(jìn)行數(shù)據(jù)導(dǎo)入導(dǎo)出。

三、數(shù)據(jù)可視化

在實(shí)際工業(yè)生產(chǎn)實(shí)踐中,對于待處理的大數(shù)據(jù),首先是數(shù)據(jù)特征探索階段,也就是做數(shù)據(jù)可視化,對數(shù)據(jù)有個(gè)初步的了解,才會(huì)知道所拿到的數(shù)據(jù)能否解決面臨的實(shí)際問題,適用于什么算法。對于無編程能力的人,只需要掌握數(shù)據(jù)分析和處理的能力,即可靈活使用可視化類工具如Tableau,通過拖拉拽形成聯(lián)動(dòng),大大縮短數(shù)據(jù)分析流程。從連接數(shù)據(jù)源、建立工作表、構(gòu)建各種圖表、儀表板進(jìn)行可視化展示,進(jìn)行交叉分析。對于有編程能力的人可以使用R、Python進(jìn)行數(shù)據(jù)可視化。

四、數(shù)據(jù)特征提取及清洗

數(shù)據(jù)可視化之后,需要對數(shù)據(jù)進(jìn)行清洗,對數(shù)據(jù)中的噪聲進(jìn)行處理以支持后續(xù)數(shù)據(jù)建模。常見的比如進(jìn)行降維,提取出對實(shí)際問題相關(guān)性較高的特征因子后,再回歸到大數(shù)據(jù),或者做相關(guān)性分析、主成分分析等。

五、數(shù)據(jù)分析及挖掘

數(shù)據(jù)統(tǒng)計(jì)及分析主要是基于存儲(chǔ)的海量數(shù)據(jù)進(jìn)行普通的分析和分類匯總,以滿足大多數(shù)常見的分析需求。數(shù)據(jù)挖掘一般沒有預(yù)先設(shè)定好的主題,主要是在現(xiàn)有數(shù)據(jù)上面進(jìn)行基于各種算法的計(jì)算,從而起到預(yù)測的效果,實(shí)現(xiàn)高級別的數(shù)

據(jù)分析的需求,豐富的歷史數(shù)據(jù)是數(shù)據(jù)挖掘的先決條件。比較典型的算法有回歸、分類、聚類、關(guān)聯(lián)分析。機(jī)器學(xué)習(xí)正是如此,分為監(jiān)督式學(xué)習(xí)算法、無監(jiān)督式學(xué)習(xí)算法、半監(jiān)督式學(xué)習(xí)算法。

六、機(jī)器學(xué)習(xí)

監(jiān)督式學(xué)習(xí)算法是從帶標(biāo)簽(標(biāo)注)的訓(xùn)練樣本中建立的訓(xùn)練樣本中建立模式,并依此推測新的數(shù)據(jù)標(biāo)簽的算法。比如回歸、神經(jīng)網(wǎng)絡(luò)、決策樹、支持向量機(jī)、貝葉斯、隨機(jī)森林。無監(jiān)督式學(xué)習(xí)算法是在學(xué)習(xí)時(shí)并不知道其分類結(jié)果,目的是去對原始資料進(jìn)行分類,以便了解資料內(nèi)部結(jié)構(gòu)的算法。比如聚類、主成分分析、線性判別分析降維。半監(jiān)督式學(xué)習(xí)算法是利用少量標(biāo)注樣本和大量未標(biāo)注樣本進(jìn)行機(jī)器學(xué)習(xí),利用數(shù)據(jù)分布上的模型假設(shè),建立學(xué)習(xí)器對未標(biāo)簽樣本進(jìn)行標(biāo)簽。

機(jī)器學(xué)習(xí)正被廣泛應(yīng)用于計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理等方面。其中深度學(xué)習(xí)強(qiáng)調(diào)模型深度,通過逐層特征變換,將樣本在原空間的特征表示變換到一個(gè)新特征空間,從而使分類或預(yù)測更容易準(zhǔn)確,更能夠刻畫數(shù)據(jù)的豐富內(nèi)在信息,其實(shí)際應(yīng)用對象不僅包含語音、圖像、視頻,同樣也包含文本、語言和語義信息。另外,卷積神經(jīng)網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)的一種,為識(shí)別二維形狀而特殊設(shè)計(jì)的多層感知器,擅長處理圖像特別是大圖像的相關(guān)機(jī)器學(xué)習(xí)問題,對圖像平移、比例縮放、傾斜或者其他形式的變形具有高度不變性,它的布局更接近于實(shí)際的生物神經(jīng)網(wǎng)絡(luò),被廣泛應(yīng)用。當(dāng)前實(shí)現(xiàn)機(jī)器學(xué)習(xí)比較常見的兩種主流方式是Spark和Tensorflow框架。機(jī)器學(xué)習(xí)作為人工智能的核心,是企業(yè)搭建大數(shù)據(jù)平臺(tái)的重要節(jié)點(diǎn),需要結(jié)合業(yè)務(wù)邏輯,按需選擇合適的算法模型,不斷調(diào)參調(diào)優(yōu),使機(jī)器學(xué)習(xí)服務(wù)于企業(yè)經(jīng)營。

七、數(shù)據(jù)倉庫

數(shù)據(jù)倉庫是為了便于多維分析和多角度展示數(shù)據(jù)按特定模式進(jìn)行存儲(chǔ)所建立起來的關(guān)系型數(shù)據(jù)庫。在商業(yè)智能系統(tǒng)的設(shè)計(jì)中,數(shù)據(jù)倉庫的構(gòu)建是關(guān)鍵,是商業(yè)智能系統(tǒng)的基礎(chǔ),承擔(dān)對業(yè)務(wù)系統(tǒng)數(shù)據(jù)整合的任務(wù),為商業(yè)智能系統(tǒng)提供數(shù)據(jù)抽取、轉(zhuǎn)換和加載(ETL),并按主題對數(shù)據(jù)進(jìn)行查詢和訪問,為聯(lián)機(jī)數(shù)據(jù)分析和數(shù)據(jù)挖掘提供數(shù)據(jù)平臺(tái)。海量的數(shù)據(jù)包括社交網(wǎng)絡(luò)、移動(dòng)設(shè)備和傳感器等新渠道以及新技術(shù)使用所帶來的半結(jié)構(gòu)化或非結(jié)構(gòu)化的數(shù)據(jù)。大數(shù)據(jù)技術(shù)架構(gòu)可分為存儲(chǔ)、處理、應(yīng)用、展示以及整合5個(gè)部分,并可根據(jù)數(shù)據(jù)的結(jié)構(gòu)化程度對相關(guān)技術(shù)進(jìn)行選擇和組合。每個(gè)部分包含一些技術(shù)要素,而某些要素又可根據(jù)結(jié)構(gòu)化程度共同作用形成特定的功能。

從企業(yè)角度來說,無論是數(shù)據(jù)庫、數(shù)據(jù)倉庫還是大數(shù)據(jù)都是解決不同需求、處理不同級別數(shù)據(jù)量的技術(shù),它們之間并無沖突。針對不同需求和現(xiàn)狀進(jìn)行技術(shù)選擇,各種技術(shù)相互補(bǔ)充、相互協(xié)作。目前階段對于大部分企業(yè)來說,想要開展一個(gè)全新的大數(shù)據(jù)項(xiàng)目似乎無從下手。從現(xiàn)有數(shù)據(jù)倉庫建設(shè)理論和經(jīng)驗(yàn)入手,引入部分大數(shù)據(jù)技術(shù),特別是實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)的收集、存儲(chǔ)和處理是一種比較可行的方法。

基于云計(jì)算的Hadoop大數(shù)據(jù)框架,利用集群的威力高速運(yùn)算和存儲(chǔ),實(shí)現(xiàn)了一個(gè)分布式運(yùn)行系統(tǒng),以流的形式提供高傳輸率來訪問數(shù)據(jù),適應(yīng)了大數(shù)據(jù)的應(yīng)用程序。將Hadoop技術(shù)應(yīng)用于對數(shù)據(jù)的采集、ETL、存儲(chǔ)、處理,開發(fā)提供給傳統(tǒng)的數(shù)據(jù)倉庫BI工具,其架構(gòu)如圖所示。利用Hadoop強(qiáng)大的數(shù)據(jù)處理能力,將各類數(shù)據(jù)處理成結(jié)構(gòu)化數(shù)據(jù),向上提供給傳統(tǒng)BI工具,對數(shù)據(jù)進(jìn)行分析和結(jié)果展示。

八、數(shù)據(jù)安全

大數(shù)據(jù)蘊(yùn)藏著價(jià)值信息,但數(shù)據(jù)安全面臨著嚴(yán)峻挑戰(zhàn)。一方面,大數(shù)據(jù)本身的安全防護(hù)存在漏洞。雖然云計(jì)算對大數(shù)據(jù)提供了便利,但對大數(shù)據(jù)的安全控制力度不夠,API訪問權(quán)限控制以及密鑰生產(chǎn),存儲(chǔ)和管理方面的不足都可能造成數(shù)據(jù)泄露。另一方面,在用數(shù)據(jù)挖掘和數(shù)據(jù)分析等大數(shù)據(jù)技術(shù)獲取價(jià)值信息的同時(shí),攻擊者也在利用這些大數(shù)據(jù)技術(shù)進(jìn)行攻擊。

當(dāng)然大數(shù)據(jù)也為數(shù)據(jù)安全的發(fā)展提供了機(jī)會(huì),對海量數(shù)據(jù)的分析有助于更好的跟蹤網(wǎng)絡(luò)異常行為,對實(shí)時(shí)安全和應(yīng)用數(shù)據(jù)結(jié)合在一起的數(shù)據(jù)進(jìn)行預(yù)防性分析,可防止詐騙和黑客入侵。網(wǎng)絡(luò)攻擊行為留下的痕跡數(shù)據(jù)以數(shù)據(jù)的形式隱藏在大數(shù)據(jù)中,從大數(shù)據(jù)的存儲(chǔ),應(yīng)用和管理方面把關(guān),可以有針對性的應(yīng)對數(shù)據(jù)安全威脅。企業(yè)需要將大數(shù)據(jù)技術(shù)和安全并行,大數(shù)據(jù)才可以真正成為企業(yè)長遠(yuǎn)發(fā)展的驅(qū)動(dòng)力量。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    FPGA 模塊:工業(yè)自動(dòng)化領(lǐng)域的智能核心驅(qū)動(dòng)力

    工業(yè)自動(dòng)化是現(xiàn)代制造業(yè)核心驅(qū)動(dòng)力,通過集成先進(jìn)控制系統(tǒng)與信息技術(shù),顯著提升生產(chǎn)效率、質(zhì)量及安全性。工業(yè) 4.0 下,自動(dòng)化系統(tǒng)需處理海量數(shù)據(jù)、執(zhí)行復(fù)雜計(jì)算,且需低延遲、高可靠性,而 FPGA 等
    的頭像 發(fā)表于 03-06 18:47 ?308次閱讀
    FPGA 模塊:工業(yè)自動(dòng)化領(lǐng)域的智能核心<b class='flag-5'>驅(qū)動(dòng)力</b>

    【「芯片設(shè)計(jì)基石——EDA產(chǎn)業(yè)全景與未來展望」閱讀體驗(yàn)】--中國EDA的發(fā)展

    的核心驅(qū)動(dòng)力。 科創(chuàng)板設(shè)立、集成電路專項(xiàng)基金、政策出臺(tái)、人才回流、國產(chǎn)芯片替代都為國內(nèi)EDA的發(fā)展提供了有利條件。 國內(nèi)也出現(xiàn)了EDA企業(yè)上市,獲取更好的融資條件,提升技術(shù)實(shí)力。 其次
    發(fā)表于 01-20 23:22

    數(shù)據(jù)中心發(fā)展的三大驅(qū)動(dòng)力

    、可靠的基礎(chǔ)支持。相關(guān)部門明確了加快5G網(wǎng)絡(luò)、大數(shù)據(jù)中心等新型基礎(chǔ)設(shè)施建設(shè)進(jìn)度, 數(shù)據(jù)中心發(fā)展的三大驅(qū)動(dòng)力 1、中國對于數(shù)據(jù)中心的政策支持
    的頭像 發(fā)表于 12-26 10:34 ?381次閱讀

    大數(shù)據(jù)平臺(tái)運(yùn)營的基礎(chǔ)是什么

    ,值得每一位企業(yè)運(yùn)營者思考。 本文提供大數(shù)據(jù)平臺(tái)運(yùn)營的三元素模型,旨在幫助企業(yè)管理層以全面的視角審視企業(yè)當(dāng)前正在建設(shè)的大數(shù)據(jù)體系,真正地實(shí)現(xiàn)
    的頭像 發(fā)表于 12-23 16:07 ?242次閱讀

    華為數(shù)字技術(shù)推動(dòng)交通高質(zhì)量發(fā)展

    當(dāng)前,人工智能(AI)浪潮席卷全球,成為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量,將對全球經(jīng)濟(jì)社會(huì)發(fā)展和人類文明進(jìn)步產(chǎn)生深遠(yuǎn)影響。傳統(tǒng)的生產(chǎn)、生活與學(xué)習(xí)方式,將被深刻重構(gòu)。千行萬業(yè)的數(shù)智化進(jìn)程,正在全面加速。
    的頭像 發(fā)表于 10-30 11:15 ?785次閱讀

    AI智能體:推動(dòng)企業(yè)變革的核心驅(qū)動(dòng)力

    在數(shù)字經(jīng)濟(jì)時(shí)代,AI智能體正成為推動(dòng)企業(yè)變革的核心驅(qū)動(dòng)力。作為融合人工智能技術(shù)與業(yè)務(wù)場景的數(shù)字化代理,AI智能體通過模擬人類認(rèn)知與決策能力,為企業(yè)
    的頭像 發(fā)表于 07-29 17:22 ?699次閱讀
    AI智能體:推動(dòng)<b class='flag-5'>企業(yè)</b>變革的核心<b class='flag-5'>驅(qū)動(dòng)力</b>

    RFID無線測溫技術(shù):輸配電設(shè)備智能升級的核心驅(qū)動(dòng)力

    在數(shù)字化與智能化飛速發(fā)展的時(shí)代,智能升級已成為輸配電領(lǐng)域的必然趨勢。在這一過程中,RFID無線測溫技術(shù)正嶄露頭角,成為推動(dòng)輸配電設(shè)備智能升級的核心驅(qū)
    的頭像 發(fā)表于 07-09 15:31 ?631次閱讀
    RFID無線測溫<b class='flag-5'>技術(shù)</b>:輸配電設(shè)備智能升級的核心<b class='flag-5'>驅(qū)動(dòng)力</b>

    CES Asia 2025 低空經(jīng)濟(jì)專館:思想碰撞,引領(lǐng)低空經(jīng)濟(jì)規(guī)則升級

    思想的碰撞,共同引領(lǐng)低空經(jīng)濟(jì)產(chǎn)業(yè)規(guī)則的升級,為產(chǎn)業(yè)的長遠(yuǎn)發(fā)展奠定堅(jiān)實(shí)基礎(chǔ)。 權(quán)威力量齊聚,構(gòu)建產(chǎn)業(yè)規(guī)則創(chuàng)新引擎 CES Asia 2025 低空經(jīng)濟(jì)專館成為各方權(quán)威力量匯聚的平
    發(fā)表于 07-04 17:04

    什么是嵌入式工業(yè)平板電腦?聚徽廠家?guī)阋晃淖x懂工業(yè)智能化的核心驅(qū)動(dòng)力

    在當(dāng)今科技飛速發(fā)展的時(shí)代,工業(yè)智能化已成為全球制造業(yè)轉(zhuǎn)型升級的關(guān)鍵趨勢。在這場智能化變革中,嵌入式工業(yè)平板電腦正嶄露頭角,成為推動(dòng)工業(yè)智能化發(fā)展的核心
    的頭像 發(fā)表于 06-25 17:26 ?722次閱讀

    醫(yī)療保健領(lǐng)域數(shù)字化轉(zhuǎn)型的核心驅(qū)動(dòng)力與主要應(yīng)用場景

    隨著人工智能、大數(shù)據(jù)、云計(jì)算和物聯(lián)網(wǎng)等技術(shù)的快速發(fā)展,醫(yī)療保健行業(yè)正經(jīng)歷深刻的數(shù)字化變革。傳統(tǒng)醫(yī)療模式面臨資源分配不均、診療效率低下、慢性病管理挑戰(zhàn)等問題,而數(shù)字化技術(shù)的應(yīng)用不僅提升了
    的頭像 發(fā)表于 06-12 14:47 ?3597次閱讀
    醫(yī)療保健領(lǐng)域數(shù)字化轉(zhuǎn)型的核心<b class='flag-5'>驅(qū)動(dòng)力</b>與主要應(yīng)用場景

    輪邊驅(qū)動(dòng)電機(jī)專利技術(shù)發(fā)展

    ,具有較高的靈敏度。 本文主要以 DWPI 專利數(shù)據(jù)庫以及 CNABS 數(shù)據(jù)庫中的檢索結(jié)果為分析樣本,從專利文獻(xiàn)的視角對輪邊驅(qū)動(dòng)電機(jī)的技術(shù)發(fā)展進(jìn)行了全面的統(tǒng)計(jì)分析,總結(jié)了與輪邊
    發(fā)表于 06-10 13:15

    英泰斯特入選湖北省數(shù)據(jù)要素型企業(yè)

    湖北省數(shù)據(jù)要素型企業(yè)評選旨在挖掘和培育以數(shù)據(jù)為核心驅(qū)動(dòng)力的標(biāo)桿企業(yè),推動(dòng)數(shù)據(jù)要素市場化配置改革,
    的頭像 發(fā)表于 05-30 15:04 ?1036次閱讀

    英泰斯特與東湖大數(shù)據(jù)、動(dòng)力再生簽署戰(zhàn)略合作協(xié)議

    近日,武漢英泰斯特電子技術(shù)有限公司(以下簡稱:英泰斯特)分別與武漢東湖大數(shù)據(jù)科技股份有限公司(以下簡稱:東湖大數(shù)據(jù))、武漢動(dòng)力電池再生技術(shù)
    的頭像 發(fā)表于 05-08 09:25 ?931次閱讀

    工業(yè)電機(jī)行業(yè)現(xiàn)狀及未來發(fā)展趨勢分析

    引言:工業(yè)電機(jī)行業(yè)作為現(xiàn)代制造業(yè)的核心動(dòng)力設(shè)備之一,具有廣闊的發(fā)展前景和巨大的市場潛力。隨著技術(shù)的不斷進(jìn)步和市場需求的持續(xù)增長,工業(yè)電機(jī)行業(yè)將迎來更多的發(fā)展機(jī)遇和挑戰(zhàn)。以下是中研網(wǎng)通過
    發(fā)表于 03-31 14:35

    DeepSeek企業(yè)級部署實(shí)戰(zhàn)指南:以Raksmart企業(yè)服務(wù)器為例

    隨著人工智能技術(shù)的快速發(fā)展,DeepSeek作為一款強(qiáng)大的AI工具,正在成為企業(yè)智能化轉(zhuǎn)型的重要驅(qū)動(dòng)力。本文將結(jié)合Raksmart
    的頭像 發(fā)表于 03-12 11:33 ?1131次閱讀