91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大數(shù)據(jù)計算引擎,你pick哪個?

8g3K_AI_Thinker ? 來源:人工智能頭條 ? 2019-11-22 15:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

不知道你是否有過和我類似的經(jīng)歷?

我是 2018 年 6 月加入公司,一直負責監(jiān)控平臺的告警系統(tǒng)。之后,我們的整個監(jiān)控平臺架構中途換過兩次,其中一次架構發(fā)生了巨大的變化。我們監(jiān)控告警平臺最早的架構如下圖所示:

這個架構的挑戰(zhàn)難點在于:

海量的監(jiān)控數(shù)據(jù)(Metric & Log & Trace 數(shù)據(jù))實時寫入 ElasticSearch;

多維度的監(jiān)控指標頁面展示(Dashboard) 查 ElasticSearch 的數(shù)據(jù)比較頻繁;

不斷遞增的告警規(guī)則需要通過查詢 ElasticSearch 數(shù)據(jù)來進行判斷是否要告警。

從上面的幾個問題我們就可以很明顯的發(fā)現(xiàn)這種架構的瓶頸就在于 ElasticSearch 集群的寫入和查詢能力,在海量的監(jiān)控數(shù)據(jù)(Metric & Log & Trace 數(shù)據(jù))下實時的寫入對 ElasticSearch 有極大的影響。 我依然清楚記得,當時經(jīng)常因為寫入的問題導致 ElasticSearch 集群掛掉,從而讓我的告警和監(jiān)控頁面(Dashboard)歇菜(那會老被噴:為啥配置的告警規(guī)則沒有觸發(fā)告警?為啥查看應用的 Dashboard 監(jiān)控頁面沒數(shù)據(jù))。我也很無奈啊,只想祈禱我們的 ElasticSearch 集群穩(wěn)一點。

01

初次接觸 Flink

在如此糟糕的架構情況下,我們挺過了幾個月,后面由于一些特殊的原因,我們監(jiān)控平臺組的整體做了一個很大的架構調整,如下圖:

主要做了四點改變:

接入 Flink 集群去消費 Kafka 數(shù)據(jù),告警的 Flink Job 消費 Kafka 數(shù)據(jù)去判斷異常點,然后做告警

Metric & Trace 數(shù)據(jù)存儲到 ElasticSearch,之前還存儲在 ElasticSearch 中的有 Log 數(shù)據(jù)

Log 數(shù)據(jù)存儲到 Cassandra

Dashboard 查詢數(shù)據(jù)增加 API 查詢 Cassandra 的日志數(shù)據(jù)

原先因為 Metric & Trace & Log 的數(shù)據(jù)量一起全部實時寫入到 ElasticSearch 中,對 ElasticSearch 的壓力很大,所以我們將 Log 的數(shù)據(jù)拆分存儲到 Cassandra 中,分擔了一些 ElasticSearch 的寫入壓力。 但是過后我們發(fā)現(xiàn)偶爾還會出現(xiàn)數(shù)據(jù)實時寫入到 ElasticSearch 集群把 ElasticSearch 寫掛的情況。所以那會不斷調優(yōu)我們的寫入數(shù)據(jù)到 ElasticSearch 的 Flink Job,然后也對 ElasticSearch 服務端做了不少的性能調優(yōu)。 另外那會我們的監(jiān)控數(shù)據(jù)是以 10s 一次為單位將采集的數(shù)據(jù)發(fā)上來的,后面我們調整了下數(shù)據(jù)采集的策略(變成 30s 一次為單位采集數(shù)據(jù)),采取多種調優(yōu)策略后,終于將我們的 ElasticSearch 弄穩(wěn)定了。

02

遇到 Flink 相關的挑戰(zhàn)

替換成這種新架構后,由于組里沒人熟悉 Flink,再加上那會兒 Flink 的資料真的很少很少,所以當時在組里對 Flink 這塊大家都是從 0 開始學習,于大家而言挑戰(zhàn)還挺大的。

那時候我們跑在 Flink 上面的 Job 也遇到各種各樣的問題:

消費 Kafka 數(shù)據(jù)延遲

checkpoint 失敗

窗口概念模糊、使用操作有誤

Event Time 和 Processing Time 選擇有誤

不知道怎么利用 Watermark 機制來處理亂序和延遲的數(shù)據(jù)

Flink 自帶的 Connector 的優(yōu)化

Flink 中的 JobManager 和 TaskManager 經(jīng)常掛導致 Flink Job 重啟

Flink 集群模式的選型

...

因為碰到的各種各樣的問題,所以才會促使我們不斷地學習 Flink 的原理和內部機制,然后慢慢去解決上面遇到的各種問題,并逐步穩(wěn)定我們監(jiān)控平臺運行的 Flink Job。

03

為什么要學習 Flink?

隨著大數(shù)據(jù)的不斷發(fā)展,對數(shù)據(jù)的及時性要求越來越高,實時場景需求也變得越來越多,主要分下面幾大類:

那么為了滿足這些實時場景的需求,衍生出不少計算引擎框架,現(xiàn)有市面上的大數(shù)據(jù)計算引擎的對比如下:

可以發(fā)現(xiàn)無論從 Flink 的架構設計上,還是從其功能完整性和易用性來講都是領先的,再加上Flink 是阿里巴巴主推的計算引擎框架,所以從去年開始就越來越火了! 雖然市面上講 Flink 的太少太少,國內的中文資料太欠缺,已有的幾本書籍也不甚詳盡,但是國內在阿里的推動下,我相信 Flink 會越來越火的,并且阿里內部也將 Flink 做了一定的優(yōu)化和修改,叫 Blink,今年年初也將源碼貢獻到 Flink 上面,后面在 Flink 1.9 版本會將 Blink 的功能進行合并到 Flink 上去。 目前,阿里巴巴、騰訊、美團、華為、滴滴出行、攜程、餓了么、愛奇藝、有贊、唯品會等大廠都已經(jīng)將 Flink 實踐于公司大型項目中,帶起了一波 Flink 風潮,勢必也會讓 Flink 人才市場產(chǎn)生供不應求的招聘現(xiàn)象。

04

我為什么要寫 FLink 專欄?

在這個過程中我持續(xù)記錄自己的 Flink 學習之路,目前已經(jīng)對外公布了 20+ 篇 Flink 的個人學習博客,同時好多對 Flink 感興趣的童鞋也加我一起討論問題。 每天群里的童鞋會提很多遇到的 Flink 問題,但是我發(fā)現(xiàn)得到的回答比較少,其實這并不是因為群里大佬不活躍,而是因為大家對 Flink 的了解還不是很多,比如有的是大數(shù)據(jù)工程師但之前是搞 Spark 這塊的,有的是轉大數(shù)據(jù)開發(fā)的后端開發(fā)工程師,有的是對 Flink 這塊比較感興趣的研究生等。 因為自己就是從 Flink 小白過來的,所以知道初學者可能會遇到的哪些問題。當你回首的時候,你可能會發(fā)現(xiàn),這么簡單的問題自己當時那么費力地折騰了半天都出不來。這種時候要是有人指點一下,可以節(jié)省多少功夫??! 所以自己在心里萌生了一個想法:寫一個 Flink 專欄幫助大家盡快地從小白階段過渡到入門階段,然后再從入門到能夠將 Flink 用上,在生產(chǎn)環(huán)境真正把你的 Flink Job 運行起來,再做到能夠根據(jù)你生產(chǎn)環(huán)境出現(xiàn)的錯誤進行排查并解決,還能根據(jù)你的 Job 的運行狀況進一步優(yōu)化!

專欄亮點

全網(wǎng)首個使用最新版本 Flink 1.9 進行內容講解(該版本更新很大,架構功能都有更新),領跑于目前市面上常見的 Flink 1.7 版本的教學課程。

包含大量的實戰(zhàn)案例和代碼去講解原理,有助于讀者一邊學習一邊敲代碼,達到更快,更深刻的學習境界。目前市面上的書籍沒有任何實戰(zhàn)的內容,還只是講解純概念和翻譯官網(wǎng)。

在專欄高級篇中,根據(jù) Flink 常見的項目問題提供了排查和解決的思維方法,并通過這些問題探究了為什么會出現(xiàn)這類問題。

在實戰(zhàn)和案例篇,圍繞大廠公司的經(jīng)典需求進行分析,包括架構設計、每個環(huán)節(jié)的操作、代碼實現(xiàn)都有一一講解。

專欄內容

預備篇

介紹實時計算常見的使用場景,講解 Flink 的特性,并且對比了 Spark Streaming、Structured Streaming 和 Storm 等大數(shù)據(jù)處理引擎,然后準備環(huán)境并通過兩個 Flink 應用程序帶大家上手 Flink。

基礎篇

深入講解 Flink 中 Time、Window、Watermark、Connector 原理,并有大量文章篇幅(含詳細代碼)講解如何去使用這些 Connector(比如 Kafka、ElasticSearch、HBase、Redis、MySQL 等),并且會講解使用過程中可能會遇到的坑,還教大家如何去自定義 Connector。

進階篇

講解 Flink 中 State、Checkpoint、Savepoint、內存管理機制、CEP、Table/SQL API、Machine Learning 、Gelly。在這篇中不僅只講概念,還會講解如何去使用 State、如何配置 Checkpoint、Checkpoint 的流程和如何利用 CEP 處理復雜事件。

高級篇

重點介紹 Flink 作業(yè)上線后的監(jiān)控運維:如何保證高可用、如何定位和排查反壓問題、如何合理的設置作業(yè)的并行度、如何保證 Exactly Once、如何處理數(shù)據(jù)傾斜問題、如何調優(yōu)整個作業(yè)的執(zhí)行效率、如何監(jiān)控 Flink 及其作業(yè)?

實戰(zhàn)篇

教大家如何分析實時計算場景的需求,并使用 Flink 里面的技術去實現(xiàn)這些需求,比如實時統(tǒng)計 PV/UV、實時統(tǒng)計商品銷售額 TopK、應用 Error 日志實時告警、機器宕機告警。這些需求如何使用 Flink 實現(xiàn)的都會提供完整的代碼供大家參考,通過這些需求你可以學到 ProcessFunction、Async I/O、廣播變量等知識的使用方式。

系統(tǒng)案例篇

講解大型流量下的真實案例:如何去實時處理海量日志(錯誤日志實時告警/日志實時 ETL/日志實時展示/日志實時搜索)、基于 Flink 的百億數(shù)據(jù)實時去重實踐(從去重的通用解決方案 --> 使用 BloomFilter 來實現(xiàn)去重 --> 使用 Flink 的 KeyedState 實現(xiàn)去重)。


▲Flink 專欄思維導圖

多圖講解 Flink 知識點

▲Flink 支持多種時間語義

▲Flink 提供靈活的窗口

▲Flink On YARN

▲Flink Checkpoint

▲Flink 監(jiān)控

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:大數(shù)據(jù)計算引擎,你 pick 哪個?

文章出處:【微信號:AI_Thinker,微信公眾號:人工智能頭條】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    大數(shù)據(jù)解決方案如何實施

    大數(shù)據(jù)解決方案實施的難點在于以下幾點: ?1.很少有優(yōu)質可用的數(shù)據(jù) ?在數(shù)聚股份看來,這幾年數(shù)據(jù)交易機構如雨后春筍,“數(shù)據(jù)變現(xiàn)”成為很多擁有數(shù)據(jù)
    的頭像 發(fā)表于 12-25 18:22 ?1100次閱讀

    大數(shù)據(jù)平臺運營的基礎是什么

    在數(shù)聚股份看來,越來越多的企業(yè)開始搭建自己的大數(shù)據(jù)平臺體系,并傾注大量資源用于平臺的迭代和運營。那么大數(shù)據(jù)平臺作為越來越被關注的企業(yè)新興價值點,它應該以何種方式看待,并且以什么樣的方式去建設和運營
    的頭像 發(fā)表于 12-23 16:07 ?295次閱讀

    硬件加密引擎在保障數(shù)據(jù)安全方面有哪些優(yōu)勢呢?

    通過專用電路(如 AES、RSA 等算法的專用邏輯單元)實現(xiàn)加密運算,可并行處理數(shù)據(jù)流,避免軟件加密依賴 CPU 通用計算資源的瓶頸。例如,在物聯(lián)網(wǎng)設備傳輸海量傳感器數(shù)據(jù)時,硬件加密引擎
    發(fā)表于 11-17 06:47

    覺得哪個軟件寫verilog體驗最好?有什么優(yōu)勢?

    覺得哪個軟件寫verilog體驗最好?有什么優(yōu)勢?請在評論區(qū)留言跟大家分享一下吧。
    發(fā)表于 11-10 07:47

    2025年七大數(shù)據(jù)防泄密軟件權威盤點:為的機密數(shù)據(jù)提供持續(xù)守護

    2025年七大數(shù)據(jù)防泄密軟件權威盤點:為的機密數(shù)據(jù)提供持續(xù)守護 無論是內部員工的無意泄露,還是外部黑客的有意竊取,都可能給企業(yè)帶來巨大的經(jīng)濟損失和聲譽損害。 如何選擇一款可靠的數(shù)據(jù)
    的頭像 發(fā)表于 09-30 10:46 ?546次閱讀

    御控工業(yè)物聯(lián)網(wǎng)大數(shù)據(jù)解決方案:排水設備遠程監(jiān)控與大數(shù)據(jù)統(tǒng)計系統(tǒng)

    御控工業(yè)物聯(lián)網(wǎng)推出排水設備遠程監(jiān)控與大數(shù)據(jù)統(tǒng)計系統(tǒng),通過物聯(lián)網(wǎng)、大數(shù)據(jù)、云計算等技術構建“感知-傳輸-分析-決策”閉環(huán)管理體系,助力排水行業(yè)數(shù)字化轉型。
    的頭像 發(fā)表于 09-12 10:04 ?728次閱讀

    D3000飛騰工控主板,為數(shù)字中國提供核心計算引擎

    在數(shù)字中國建設的宏偉征程中,核心計算能力猶如基石,支撐著各個領域數(shù)字化轉型與發(fā)展。飛騰工控主板憑借良好的性能、強大的適應性和廣泛的應用潛力,正逐漸嶄露頭角,成為數(shù)字中國建設重要的核心計算引擎。
    的頭像 發(fā)表于 07-29 09:08 ?519次閱讀

    信而泰×DeepSeek:AI推理引擎驅動網(wǎng)絡智能診斷邁向 “自愈”時代

    診斷方案,為網(wǎng)絡運維帶來顯著的實用價值:1.快速提升故障處理效率l 實時監(jiān)控與智能預警: AI引擎持續(xù)分析海量流量、設備狀態(tài)及日志數(shù)據(jù),實時識別異常模式(如流量突增、延遲抖動、微小丟包),實現(xiàn)故障發(fā)生
    發(fā)表于 07-16 15:29

    邊緣計算網(wǎng)關哪個好用?有哪些推薦?

    如果正在工業(yè)物聯(lián)網(wǎng)項目中尋找可靠的邊緣計算網(wǎng)關,面對市場上眾多品牌和型號,確實容易陷入“選擇困難”。以下是一些市場上表現(xiàn)較為出色的邊緣計算網(wǎng)關品牌排行(不分先后),希望能給你帶來一些參考。
    的頭像 發(fā)表于 07-05 15:47 ?928次閱讀

    工業(yè)自動化的未來已來:邊緣計算如何成為新增長引擎?

    是否還在用“傳統(tǒng)中心化”方式處理工廠數(shù)據(jù)?邊緣計算正在成為工業(yè)自動化的新常態(tài),不僅重塑了工廠數(shù)據(jù)架構,更直接推動了運營效率和收入增長。本篇文章深入剖析了邊緣
    的頭像 發(fā)表于 06-12 11:56 ?610次閱讀
    工業(yè)自動化的未來已來:邊緣<b class='flag-5'>計算</b>如何成為新增長<b class='flag-5'>引擎</b>?

    RISC-V向量處理器:現(xiàn)代計算的革命性引擎

    在數(shù)字化高速發(fā)展的當下,人工智能、大數(shù)據(jù)處理、物聯(lián)網(wǎng)等前沿技術日新月異,現(xiàn)代計算需求面臨著嚴峻挑戰(zhàn)。海量數(shù)據(jù)的爆發(fā)式增長,讓傳統(tǒng)計算架構在處理大規(guī)模
    的頭像 發(fā)表于 06-04 10:03 ?1802次閱讀
    RISC-V向量處理器:現(xiàn)代<b class='flag-5'>計算</b>的革命性<b class='flag-5'>引擎</b>

    更改最大數(shù)據(jù)包大小時無法識別USB設備如何解決?

    將生產(chǎn)者 EP 端點描述符中的最大數(shù)據(jù)包大小從 1024 字節(jié)更改為 512 字節(jié)時,無法識別 USB 設備。 請告知如何解決這個問題。
    發(fā)表于 05-20 08:13

    接地電阻柜與云計算、大數(shù)據(jù)關系緊密

    為配合實現(xiàn)大數(shù)據(jù),必須籌建更多的云計算數(shù)據(jù)中心,用到很多的發(fā)電機組,如何更好的保護這些發(fā)電機組,是急需解決的一大難題。國際上廣泛采用中性點經(jīng)電阻接地,即在中性點和接地相中間安裝接地電阻柜
    的頭像 發(fā)表于 05-07 06:30 ?620次閱讀
    接地電阻柜與云<b class='flag-5'>計算</b>、<b class='flag-5'>大數(shù)據(jù)</b>關系緊密

    四維圖新與火山引擎達成戰(zhàn)略合作

    近日,第二十一屆上海國際車展期間,智能出行領域領先企業(yè)四維圖新與字節(jié)跳動旗下云服務品牌火山引擎正式簽署戰(zhàn)略合作協(xié)議。雙方將基于人工智能、大數(shù)據(jù)及云計算技術,圍繞輔助駕駛系統(tǒng)、智能座艙及大模型應用等核心領域展開深度合作,雙方強強聯(lián)
    的頭像 發(fā)表于 04-29 16:24 ?1092次閱讀

    安徽京準:GPS北斗衛(wèi)星校時服務器助力大數(shù)據(jù)計算

    安徽京準:GPS北斗衛(wèi)星校時服務器助力大數(shù)據(jù)計算
    的頭像 發(fā)表于 04-02 09:27 ?803次閱讀