91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

快速學(xué)習(xí)Spark和Hadoop的架構(gòu)的方法

IT家園 ? 2019-07-18 09:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Spark和Hadoop的架構(gòu)區(qū)別是什么,什么是spark,什么是Hadoop,怎么樣學(xué)習(xí)這些知識(shí)點(diǎn)?

總的來說,Spark采用更先進(jìn)的架構(gòu),使得靈活性、易用性、性能等方面都比Hadoop更有優(yōu)勢,有取代Hadoop的趨勢,但其穩(wěn)定性有待進(jìn)一步提高。我總結(jié),具體表現(xiàn)在如下幾個(gè)方面。

Spark和Hadoop的架構(gòu)有什么不同之處

Q:Spark和Hadoop的架構(gòu)區(qū)別

A:

Hadoop:MapRedcue由Map和Reduce兩個(gè)階段,并通過shuffle將兩個(gè)階段連接起來的。但是套用MapReduce模型解決問題,不得不將問題分解為若干個(gè)有依賴關(guān)系的子問題,每個(gè)子問題對應(yīng)一個(gè)MapReduce作業(yè),最終所有這些作業(yè)形成一個(gè)DAG。

Spark:是通用的DAG框架,可以將多個(gè)有依賴關(guān)系的作業(yè)轉(zhuǎn)換為一個(gè)大的DAG。核心思想是將Map和Reduce兩個(gè)操作進(jìn)一步拆分為多個(gè)元操作,這些元操作可以靈活組合,產(chǎn)生新的操作,并經(jīng)過一些控制程序組裝后形成一個(gè)大的DAG作業(yè)。

Q:Spark和Hadoop的中間計(jì)算結(jié)果處理區(qū)別

A:

Hadoop:在DAG中,由于有多個(gè)MapReduce作業(yè)組成,每個(gè)作業(yè)都會(huì)從HDFS上讀取一次數(shù)據(jù)和寫一次數(shù)據(jù)(默認(rèn)寫三份),即使這些MapReduce作業(yè)產(chǎn)生的數(shù)據(jù)是中間數(shù)據(jù)也需要寫HDFS。這種表達(dá)作業(yè)依賴關(guān)系的方式比較低效,會(huì)浪費(fèi)大量不必要的磁盤和網(wǎng)絡(luò)IO,根本原因是作業(yè)之間產(chǎn)生的數(shù)據(jù)不是直接流動(dòng)的,而是借助HDFS作為共享數(shù)據(jù)存儲(chǔ)系統(tǒng)。

Spark:在Spark中,使用內(nèi)存(內(nèi)存不夠使用本地磁盤)替代了使用HDFS存儲(chǔ)中間結(jié)果。對于迭代運(yùn)算效率更高。

Q:Spark和Hadoop的操作模型區(qū)別

A:

Hadoop:只提供了Map和Reduce兩種操作所有的作業(yè)都得轉(zhuǎn)換成Map和Reduce的操作。

Spark:提供很多種的數(shù)據(jù)集操作類型比如Transformations 包括map, filter, flatMap, sample, groupByKey, reduceByKey, union, join, cogroup, mapValues,sort,partionBy等多種操作類型,還提供actions操作包括Count,collect, reduce, lookup, save等多種。這些多種多樣的數(shù)據(jù)集操作類型,給開發(fā)上層應(yīng)用的用戶提供了方便。

Q:spark中的RDD是什么,有哪些特性?

A:

A list of partitions:一個(gè)分區(qū)列表,RDD中的數(shù)據(jù)都存儲(chǔ)在一個(gè)分區(qū)列表中

A function for computing each split:作用在每一個(gè)分區(qū)中的函數(shù)

A list of dependencies on other RDDs:一個(gè)RDD依賴于其他多個(gè)RDD,這個(gè)點(diǎn)很重要,RDD的容錯(cuò)機(jī)制就是依據(jù)這個(gè)特性而來的

Optionally,a Partitioner for key-value RDDs(eg:to say that the RDD is hash-partitioned):可選的,針對于kv類型的RDD才有這個(gè)特性,作用是決定了數(shù)據(jù)的來源以及數(shù)據(jù)處理后的去向

可選項(xiàng),數(shù)據(jù)本地性,數(shù)據(jù)位置最優(yōu)

Q:概述一下spark中的常用算子區(qū)別(map,mapPartitions,foreach,foreachPatition)

A:map:用于遍歷RDD,將函數(shù)應(yīng)用于每一個(gè)元素,返回新的RDD(transformation算子)

foreach:用于遍歷RDD,將函數(shù)應(yīng)用于每一個(gè)元素,無返回值(action算子)

mapPatitions:用于遍歷操作RDD中的每一個(gè)分區(qū),返回生成一個(gè)新的RDD(transformation算子)

foreachPatition:用于遍歷操作RDD中的每一個(gè)分區(qū),無返回值(action算子)

總結(jié):一般使用mapPatitions和foreachPatition算子比map和foreach更加高效,推薦使用。如果你想要學(xué)好編程技能,請留意內(nèi)蒙達(dá)內(nèi)官網(wǎng),學(xué)習(xí)技能快,我們只選對的機(jī)構(gòu)!



聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • Hadoop
    +關(guān)注

    關(guān)注

    1

    文章

    90

    瀏覽量

    16945
  • SPARK
    +關(guān)注

    關(guān)注

    1

    文章

    108

    瀏覽量

    21240
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA DGX Spark助力高等教育領(lǐng)域重大項(xiàng)目

    在全球各地的頂尖高校,NVIDIA DGX Spark 桌面超級計(jì)算機(jī)正將數(shù)據(jù)中心級的 AI 能力帶到實(shí)驗(yàn)室臺(tái)前、教師辦公室里和學(xué)生的終端設(shè)備上。在地球最南端的南極,也有一臺(tái) DGX Spark 正在威斯康星大學(xué)麥迪遜分校運(yùn)營的 IceCube 中微子天文臺(tái)中高速運(yùn)轉(zhuǎn)。
    的頭像 發(fā)表于 03-09 16:33 ?155次閱讀

    學(xué)習(xí)單片機(jī)快速方法

    學(xué)習(xí)單片機(jī)的快速方法 先介紹下單片機(jī)。把單片機(jī)說成是電子信息類專業(yè)最重要的一門課程一點(diǎn)也不為過,你在街上看到的廣告彩燈、煙花表演、紅綠燈、自動(dòng)開關(guān)門這些都可以用單片機(jī)實(shí)現(xiàn)。有了單片機(jī),你就可以寫程序
    發(fā)表于 01-14 07:42

    全新軟件與模型優(yōu)化為NVIDIA DGX Spark注入強(qiáng)大動(dòng)力

    自發(fā)布以來,NVIDIA 通過持續(xù)的軟件優(yōu)化以及與軟件合作伙伴和開源社區(qū)的緊密協(xié)作,不斷提升基于 Grace Blackwell 架構(gòu)的 DGX Spark 的性能。這些舉措在推理、訓(xùn)練和創(chuàng)意工作流方面都取得了顯著的成效。
    的頭像 發(fā)表于 01-09 10:17 ?588次閱讀

    如何在DGX Spark上運(yùn)行NVIDIA Omniverse

    首先感謝 Vigor 同學(xué)第一時(shí)間的分享,以下是具體如何在 DGX Spark 上運(yùn)行 Omniverse 的方法
    的頭像 發(fā)表于 12-17 10:13 ?622次閱讀
    如何在DGX <b class='flag-5'>Spark</b>上運(yùn)行NVIDIA Omniverse

    NVIDIA DGX Spark系統(tǒng)恢復(fù)過程與步驟

    在使用 NVIDIA DGX Spark 的過程中,可能會(huì)出現(xiàn)配置故障,而導(dǎo)致開發(fā)中斷的問題,本篇教程將帶大家了解如何一步步完成系統(tǒng)恢復(fù)。
    的頭像 發(fā)表于 11-28 09:46 ?5225次閱讀
    NVIDIA DGX <b class='flag-5'>Spark</b>系統(tǒng)恢復(fù)過程與步驟

    NVIDIA DGX Spark助力構(gòu)建自己的AI模型

    2025 年 1 月 6 日,NVIDIA 正式宣布其 Project DIGITS 項(xiàng)目,并于 3 月 18 日更名為 NVIDIA DGX Spark,進(jìn)一步公布了產(chǎn)品細(xì)節(jié)。DGX Spark
    的頭像 發(fā)表于 11-21 09:25 ?1178次閱讀
    NVIDIA DGX <b class='flag-5'>Spark</b>助力構(gòu)建自己的AI模型

    NVIDIA DGX Spark快速入門指南

    NVIDIA DGX Spark 已正式向 AI 開發(fā)者交付,對于剛?cè)胧值娜?DGX Spark,該如何進(jìn)行初始化設(shè)置?本篇文章將引導(dǎo)您完成 DGX Spark 首次設(shè)置。在初始設(shè)置的過程中,您
    的頭像 發(fā)表于 11-17 14:11 ?6088次閱讀
    NVIDIA DGX <b class='flag-5'>Spark</b><b class='flag-5'>快速</b>入門指南

    NVIDIA DGX Spark新一代AI超級計(jì)算機(jī)正式交付

    NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在 SpaceX 向埃隆·馬斯克交付 DGX Spark。
    的頭像 發(fā)表于 10-21 10:41 ?1200次閱讀

    NVIDIA DGX Spark桌面AI計(jì)算機(jī)開啟預(yù)訂

    DGX Spark 現(xiàn)已開啟預(yù)訂!麗臺(tái)科技作為 NVIDIA 授權(quán)分銷商,提供從產(chǎn)品到服務(wù)的一站式解決方案,助力輕松部署桌面 AI 計(jì)算機(jī)。
    的頭像 發(fā)表于 09-23 17:20 ?1331次閱讀
    NVIDIA DGX <b class='flag-5'>Spark</b>桌面AI計(jì)算機(jī)開啟預(yù)訂

    ARM入門學(xué)習(xí)方法分享

    。 以下是一些入門學(xué)習(xí)方法的分享: 一、 理解基本概念:首先,了解ARM是什么以及它的基本概念是很重要的。ARM(Advanced RISC Machines)指的是一種精簡指令集計(jì)算機(jī)(RISC
    發(fā)表于 07-23 10:21

    零基礎(chǔ)學(xué)習(xí)LuatOS編程:快速上手開發(fā)實(shí)戰(zhàn)教程!

    無論你是剛接觸物聯(lián)網(wǎng)編程的新手,還是希望拓展技能的技術(shù)愛好者,本教程將為零基礎(chǔ)的讀者提供一條清晰的LuatOS學(xué)習(xí)路徑。從安裝開發(fā)工具到編寫第一個(gè)程序,我們將通過實(shí)例講解核心概念,助你快速實(shí)現(xiàn)從理論
    的頭像 發(fā)表于 06-13 17:27 ?624次閱讀
    零基礎(chǔ)<b class='flag-5'>學(xué)習(xí)</b>LuatOS編程:<b class='flag-5'>快速</b>上手開發(fā)實(shí)戰(zhàn)教程!

    Transformer架構(gòu)概述

    由于Transformer模型的出現(xiàn)和快速發(fā)展,深度學(xué)習(xí)領(lǐng)域正在經(jīng)歷一場翻天覆地的變化。這些突破性的架構(gòu)不僅重新定義了自然語言處理(NLP)的標(biāo)準(zhǔn),而且拓寬了視野,徹底改變了AI的許多方面。
    的頭像 發(fā)表于 06-10 14:24 ?1295次閱讀
    Transformer<b class='flag-5'>架構(gòu)</b>概述

    常見的PFC拓?fù)?b class='flag-5'>架構(gòu)及控制方法

    本期,芯朋微技術(shù)團(tuán)隊(duì)將為各位fans分享常見的PFC拓?fù)?b class='flag-5'>架構(gòu)及控制方法,為設(shè)計(jì)選型提供參考。
    的頭像 發(fā)表于 04-27 18:03 ?7595次閱讀
    常見的PFC拓?fù)?b class='flag-5'>架構(gòu)</b>及控制<b class='flag-5'>方法</b>

    汽車電氣架構(gòu)中的電源架構(gòu)

    隨著汽車電子化、智能化的快速發(fā)展,汽車電氣架構(gòu)(E/E架構(gòu))已成為現(xiàn)代汽車的核心技術(shù)之一。
    的頭像 發(fā)表于 03-29 11:25 ?1008次閱讀

    NVIDIA加速的Apache Spark助力企業(yè)節(jié)省大量成本

    隨著 NVIDIA 推出 Aether 項(xiàng)目,通過采用 NVIDIA 加速的 Apache Spark 企業(yè)得以自動(dòng)加速其數(shù)據(jù)中心規(guī)模的分析工作負(fù)載,從而節(jié)省數(shù)百萬美元。
    的頭像 發(fā)表于 03-25 15:09 ?1169次閱讀
    NVIDIA加速的Apache <b class='flag-5'>Spark</b>助力企業(yè)節(jié)省大量成本