91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Hudi系列:Hudi核心概念之時(shí)間軸(TimeLine)

京東云 ? 來(lái)源:jf_75140285 ? 作者:jf_75140285 ? 2025-10-14 16:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Hudi系列:Hudi核心概念(版本1.0)

?Hudi架構(gòu)

?一. 時(shí)間軸(TimeLine)

?1.1 時(shí)間軸(TimeLine)概念

?1.2 Hudi的時(shí)間線由組成

?1.3 時(shí)間線上的Instant action操作類(lèi)型

?1.4 時(shí)間線上State狀態(tài)類(lèi)型

?1.5 時(shí)間線官網(wǎng)實(shí)例

?二. 文件布局

?三. 索引

?3.1 簡(jiǎn)介

?3.2 對(duì)比Hive沒(méi)有索引的區(qū)別

?3.3 Hudi索引類(lèi)型

?3.4 全局索引與非全局索引

?四. 表類(lèi)型

?4.1 COW:(Copy on Write)寫(xiě)時(shí)復(fù)制表

?4.1.1 概念

?4.1.2 COW工作原理

?4.1.3 COW表對(duì)表的管理方式改進(jìn)點(diǎn)

?4.2 MOR:(Merge on Read)讀時(shí)復(fù)制表

?4.2.1 概念

?4.2.2 MOR表工作原理

?4.3 總結(jié)了兩種表類(lèi)型之間的權(quán)衡

?五. 查詢類(lèi)型

?5.1 Snapshot Queries

?5.2 Incremental Queries

?5.3 Read Optimized Query

wKgZO2juBGGADOZsAAhLQV2E_f0689.png

?

一. 時(shí)間軸(TimeLine)

1.1 時(shí)間軸(TimeLine)概念

Hudi的核心是維護(hù)在不同時(shí)刻(Instant)在表上執(zhí)行的所有操作的時(shí)間軸,提供表的即時(shí)視圖,同時(shí)還有效地支持按時(shí)間順序檢索數(shù)據(jù)

wKgZPGjuBGKAMad8AAMeLYZuD-c572.png

?

1.2 Hudi的時(shí)間線由組成

?requested instant :

表示在時(shí)間線上請(qǐng)求操作的時(shí)間并充當(dāng)事務(wù) ID 的即時(shí)時(shí)間。在請(qǐng)求操作之前,應(yīng)該生成一個(gè)不可變的操作計(jì)劃。 

?completed instant :

表示時(shí)間軸上操作完成時(shí)間的即時(shí)時(shí)間。對(duì)表數(shù)據(jù)/元數(shù)據(jù)的所有相關(guān)更改都應(yīng)在操作完成之前進(jìn)行。

?state :

動(dòng)作的狀態(tài)。在操作的生命周期中,有效狀態(tài)為 REQUESTED、INFLIGHT 和 COMPLETED。

?type :

執(zhí)行的操作類(lèi)型。

1.3 時(shí)間線上的Instant action操作類(lèi)型

hudi保證在時(shí)間線上的操作都是基于即時(shí)時(shí)間的,兩者的時(shí)間保持一致并且是原子性的,以下是有效的操作類(lèi)型。

?COMMIT -

寫(xiě)入操作表示將一批記錄原子寫(xiě)入表中的基本文件中。

?DELTA_COMMIT -

寫(xiě)入操作表示將一批記錄原子寫(xiě)入讀合并類(lèi)型表,其中部分/全部數(shù)據(jù)可以僅寫(xiě)入增量日志。

?REPLACE_COMMIT -

寫(xiě)入操作以原子方式將表中的一組文件組替換為另一個(gè)文件組。用于實(shí)現(xiàn)批量寫(xiě)入操作,如insert_overwrite、delete_partition等,以及表服務(wù),如集群。

?CLEANS -

表服務(wù)通過(guò)刪除這些文件來(lái)從表中刪除不再需要的舊文件切片。

?COMPACTION -

表服務(wù)通過(guò)將增量文件合并到基本文件中來(lái)協(xié)調(diào)基本文件和增量文件之間的差異數(shù)據(jù)。

?LOGCOMPACTION -

表服務(wù)將多個(gè)小日志文件合并到同一文件分片中的一個(gè)更大的日志文件中。 

?CLUSTERING -

表服務(wù)以優(yōu)化的排序順序或存儲(chǔ)布局重寫(xiě)現(xiàn)有文件組,作為表中的新文件組。

?INDEXING -

表服務(wù)在表的列上構(gòu)建請(qǐng)求類(lèi)型的索引,與正在進(jìn)行的寫(xiě)入完成時(shí)表的狀態(tài)保持一致。

?ROLLBACK -

表示回滾了不成功的寫(xiě)入操作,從存儲(chǔ)中刪除了此類(lèi)寫(xiě)入期間生成的任何部分/未提交的文件。

?SAVEPOINT -

將某些文件切片標(biāo)記為“已保存”,這樣清理器就不會(huì)刪除它們。在發(fā)生災(zāi)難/數(shù)據(jù)恢復(fù)場(chǎng)景時(shí),它有助于將表恢復(fù)到時(shí)間線上的某個(gè)點(diǎn),或者在這些時(shí)刻執(zhí)行時(shí)間旅行查詢。

?RESTORE -

在發(fā)生災(zāi)難/數(shù)據(jù)恢復(fù)場(chǎng)景時(shí),將表恢復(fù)到時(shí)間線上的給定保存點(diǎn)。

1.4 時(shí)間線上State狀態(tài)類(lèi)型

任何給定的瞬間都可以處于以下?tīng)顟B(tài)之一

requested:表示一個(gè)動(dòng)作已被安排,但尚未啟動(dòng)

inflight:表是當(dāng)前正在執(zhí)行操作

completed:表是在時(shí)間線上完成了操作

1.5 時(shí)間線官網(wǎng)實(shí)例

wKgZO2juBGKAee0AAAJjA3_9Qb8434.png

?

上圖顯示了進(jìn)程 A 和 B 生成的時(shí)間如何單調(diào)增加,即使進(jìn)程 B 在開(kāi)始時(shí)的本地時(shí)鐘比 A 低,但通過(guò)等待 x ms 的不確定性窗口過(guò)去。
事實(shí)上,考慮到 Hudi 的目標(biāo)交易持續(xù)時(shí)間 > 1 秒,我們可以承受更高的不確定性界限(> 100 毫秒),從而保證極高保真度的時(shí)間生成。

文獻(xiàn): https://hudi.apache.org/docs/overview

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲(chǔ)
    +關(guān)注

    關(guān)注

    13

    文章

    4816

    瀏覽量

    90138
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    飛凌嵌入式ElfBoard-系統(tǒng)信息與資源之時(shí)間概念

    在 Linux 中,時(shí)間的管理和表示是一個(gè)復(fù)雜的主題,涉及多個(gè)概念和標(biāo)準(zhǔn),如 UTC、GMT、CST 等。下面就來(lái)簡(jiǎn)單介紹一下這幾個(gè)常見(jiàn)的時(shí)間格式的基本概念。1.UTC(協(xié)調(diào)世界時(shí))定
    發(fā)表于 01-15 08:54

    鎖存器中的時(shí)間借用概念與靜態(tài)時(shí)序分析

    對(duì)于基于鎖存器的設(shè)計(jì),靜態(tài)時(shí)序分析會(huì)應(yīng)用一個(gè)稱(chēng)為時(shí)間借用的概念。本篇博文解釋了時(shí)間借用的概念,若您的設(shè)計(jì)中包含鎖存器且時(shí)序報(bào)告中存在時(shí)間借用
    的頭像 發(fā)表于 12-31 15:25 ?5541次閱讀
    鎖存器中的<b class='flag-5'>時(shí)間</b>借用<b class='flag-5'>概念</b>與靜態(tài)時(shí)序分析

    橫河IS8000集成軟件平臺(tái)的波形疊加與時(shí)間軸調(diào)整

    深圳市科瑞杰科技有限公司-橫河IS8000集成軟件平臺(tái)的開(kāi)發(fā)理念是“合而為一”,可以將多種不同的設(shè)備整合起來(lái),也可以將不同數(shù)據(jù)源同步進(jìn)行觀測(cè)和分析。橫河IS8000的波形離線分析功能
    的頭像 發(fā)表于 12-24 17:44 ?601次閱讀
    橫河IS8000集成軟件平臺(tái)的波形疊加與<b class='flag-5'>時(shí)間軸</b>調(diào)整

    陀螺儀怎么選?

    在無(wú)人機(jī)、機(jī)器人、VR等智能設(shè)備中,姿態(tài)傳感器是感知運(yùn)動(dòng)的核心。面對(duì)市場(chǎng)上六、九、十等不同配置,該如何選擇?本文以海凌科HLK-AS201系列
    的頭像 發(fā)表于 12-22 15:27 ?786次閱讀
    多<b class='flag-5'>軸</b>陀螺儀怎么選?

    實(shí)測(cè)小課堂之時(shí)間間隔測(cè)量模塊

    測(cè)量模塊
    西安同步電子科技有限公司
    發(fā)布于 :2025年12月03日 17:19:46

    XYZ三真空直線模組定制案例與核心優(yōu)勢(shì)解讀

    的領(lǐng)域,XYZ三真空直線模組是實(shí)現(xiàn)自動(dòng)化作業(yè)的核心部件。作為深耕精密傳動(dòng)與自動(dòng)化設(shè)備領(lǐng)域的領(lǐng)軍企業(yè),飛創(chuàng)憑借多年技術(shù)積淀與創(chuàng)新研發(fā),打破傳統(tǒng)設(shè)備局限,推出XYZ三
    的頭像 發(fā)表于 12-03 09:29 ?564次閱讀
    XYZ三<b class='flag-5'>軸</b>真空直線模組定制案例與<b class='flag-5'>核心</b>優(yōu)勢(shì)解讀

    Hudi系列:Hudi核心概念之索引(Indexs)

    Hudi系列:Hudi核心概念(版本1.0) ?Hudi架構(gòu) ?一.
    的頭像 發(fā)表于 10-21 09:47 ?434次閱讀
    <b class='flag-5'>Hudi</b><b class='flag-5'>系列</b>:<b class='flag-5'>Hudi</b><b class='flag-5'>核心</b><b class='flag-5'>概念</b>之索引(Indexs)

    Hudi系列:Hudi核心概念之文件布局(Storage Layouts)

    Hudi系列:Hudi核心概念(版本1.0) ?Hudi架構(gòu) ?一.
    的頭像 發(fā)表于 10-14 16:06 ?724次閱讀
    <b class='flag-5'>Hudi</b><b class='flag-5'>系列</b>:<b class='flag-5'>Hudi</b><b class='flag-5'>核心</b><b class='flag-5'>概念</b>之文件布局(Storage Layouts)

    技術(shù):賦能無(wú)人機(jī)精準(zhǔn)配送的核心芯片應(yīng)用

    在無(wú)人機(jī)配送領(lǐng)域,離技術(shù)就像一顆 “智慧大腦”,憑借獨(dú)特設(shè)計(jì)讓無(wú)人機(jī)在復(fù)雜環(huán)境中精準(zhǔn)穿梭。它的核心秘訣藏在硬件、算法和響應(yīng)速度三大方面。 硬件上,離技術(shù)不走尋常路。昆泰芯 KTM59 系列
    發(fā)表于 09-05 16:32

    是德示波器MSOX2024A時(shí)間基準(zhǔn)穩(wěn)定性的測(cè)試方法

    值有出入,進(jìn)而使整個(gè)測(cè)量結(jié)果的準(zhǔn)確性降低,影響對(duì)信號(hào)特性的判斷與分析。 1.2 時(shí)間基準(zhǔn)不穩(wěn)定導(dǎo)致的測(cè)量誤差 時(shí)間基準(zhǔn)不穩(wěn)定會(huì)帶來(lái)多種測(cè)量誤差,如時(shí)間間隔測(cè)量誤差、頻率測(cè)量誤差等。時(shí)間
    的頭像 發(fā)表于 08-18 17:19 ?745次閱讀
    是德示波器MSOX2024A<b class='flag-5'>時(shí)間</b>基準(zhǔn)穩(wěn)定性的測(cè)試方法

    為什么三MEMS陀螺儀是無(wú)人機(jī)飛控系統(tǒng)的核心傳感器?

    在現(xiàn)代無(wú)人機(jī)技術(shù)中,三MEMS陀螺儀扮演著至關(guān)重要的角色。作為飛行控制系統(tǒng)的核心傳感器,它通過(guò)實(shí)時(shí)測(cè)量飛行器的角速度變化,為穩(wěn)定飛行提供關(guān)鍵數(shù)據(jù)支持。以ER-3MG-063 MEMS陀螺儀為例,讓我們深入了解三MEMS陀螺儀
    的頭像 發(fā)表于 08-07 17:37 ?1260次閱讀
    為什么三<b class='flag-5'>軸</b>MEMS陀螺儀是無(wú)人機(jī)飛控系統(tǒng)的<b class='flag-5'>核心</b>傳感器?

    經(jīng)皮耳迷走神經(jīng)刺激(taVNS)與心腦交互

    經(jīng)耳迷走神經(jīng)電刺激taVNS與心腦核心概念核心問(wèn)題與機(jī)制概括taVNS通過(guò)調(diào)制耳部特定靶點(diǎn)(如耳甲艇、耳屏內(nèi))的神經(jīng)輸入,增強(qiáng)前額葉theta振蕩活動(dòng)與副交感神經(jīng)介導(dǎo)的心率變異性(H
    的頭像 發(fā)表于 08-06 18:48 ?2809次閱讀
    經(jīng)皮耳迷走神經(jīng)刺激(taVNS)與心腦<b class='flag-5'>軸</b>交互

    HarmonyOS實(shí)戰(zhàn):快遞信息時(shí)間軸效果實(shí)現(xiàn)

    前言 快遞信息時(shí)間軸在購(gòu)物軟件中是必不可少的功能,通過(guò)時(shí)間軸可以展示快遞從發(fā)貨到派送的每一個(gè)環(huán)節(jié)。本篇文章通過(guò)代碼的形式詳細(xì)講解在鴻蒙日常開(kāi)發(fā)中如何實(shí)現(xiàn)時(shí)間軸的效果。(篇尾附有完整源碼) 實(shí)現(xiàn)效果
    的頭像 發(fā)表于 06-09 16:05 ?616次閱讀
    HarmonyOS實(shí)戰(zhàn):快遞信息<b class='flag-5'>時(shí)間軸</b>效果實(shí)現(xiàn)

    運(yùn)動(dòng)控制和單控制區(qū)別怎么選?工業(yè)自動(dòng)化工程師一文講透!

    在工業(yè)自動(dòng)化項(xiàng)目里,運(yùn)動(dòng)控制這件事是繞不過(guò)去的技術(shù)核心。無(wú)論你是在做機(jī)器人、自動(dòng)點(diǎn)膠機(jī),還是搞多聯(lián)動(dòng)的數(shù)控系統(tǒng),都會(huì)遇到一個(gè)讓很多技術(shù)人員頭大的問(wèn)題:運(yùn)動(dòng)控制和單控制區(qū)別到底在哪
    的頭像 發(fā)表于 05-29 10:19 ?1201次閱讀
    運(yùn)動(dòng)控制<b class='flag-5'>軸</b>和單<b class='flag-5'>軸</b>控制區(qū)別怎么選?工業(yè)自動(dòng)化工程師一文講透!

    Linux系統(tǒng)管理的核心概念

    在前一篇文章中,我們深入探討了Linux中的文件操作命令,如cp、mv、rm,以及文本處理命令grep、wc和管道符。本文將繼續(xù)深入Linux系統(tǒng)管理的核心概念,包括root用戶的角色、用戶和用戶組
    的頭像 發(fā)表于 05-15 17:05 ?717次閱讀