91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

阿里云為什么要重構數據湖解決方案 主推下一代技術

ss ? 來源:IT168 ? 作者:IT168 ? 2020-11-11 14:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數據湖并不是一個新概念,大概在十多年前,從有Hadoop開始,就有很多人提出這樣的設想。面對海量數據增長,要想挖掘數據價值,首先得有一個能夠存儲各類數據的“湖”,這個湖的“蓄水能力”要足夠強大,能存儲、分析和處理各類數據,包括結構化數據、非結構化數據、機器數據以及來自物聯(lián)網設備的數據等等。

之后,隨著大數據、云計算以及云存儲技術的不斷成熟,數據湖解決方案被主流云計算廠商極力推崇,并且演繹出不同版本。走到今天,數據湖解決方案似乎已足夠成熟,但從應用場景來看,一切才剛剛開始,還有大量變革空間,這也是阿里云為什么要重構數據湖解決方案,主推下一代技術的根本原因。

什么是下一代數據湖解決方案?

如何理解阿里云數據湖解決方案的最新特性?阿里云智能存儲產品資深總監(jiān)陳起鯤認為,數據湖解決方案由數據分析架構演化而來。

早期大數據分析架構,是強耦合擴容模式,同一份數據需要在不同的計算集群中重復拷貝,空間利用率低,計算資源過剩;但數據是不斷積累狀態(tài),并且有波峰波谷期,為了滿足業(yè)務需求,承載更多數據,計算和存儲要一起擴容。因為是兩套系統(tǒng),從生產導入數據肯定需要時間,所以會出現數據導入緩慢的狀況,最終無法實時洞察業(yè)務。

這時,聰明人就提出了數據湖架構。早期的數據湖架構一般是分布式文件存儲,可以橫向擴展,通過糾刪碼提高資源利用率;同時,計算和存儲是分離狀態(tài),你可以按需擴展算力。另外,底層是分布式文件存儲,基于塊存儲、對象存儲等很多協(xié)議,用戶可以把結構化和半結構化數據放在一起,數據可以統(tǒng)一管理,底層的分布式存儲對元數據、小文件和性能都有一定提升。

對于用戶來說,數據湖帶來的好處顯而易見,不管是過去的數據倉庫,還是現在的大數據、運營數據、交互式查詢,以及可視化數據、實時分析以及預測分析數據,都能基于數據湖進行存儲、分析,進而獲得更大的商業(yè)價值。

而從服務提供商的角度來看,各家都在說自己是最先提供數據湖解決方案的企業(yè)。事實上,數據在哪里,分析就在哪里。這也是為什么云廠商在推出數據庫產品的時候,很多用戶都愿意去嘗試。

因為產品本身就在承載互聯(lián)網場景應用,具有海量數據云上處理能力,有更強大的計算引擎,能真正和生產環(huán)境融合在一起。云與互聯(lián)網應用場景結合,才能孕育出最強大功能的解決方案,而在這方面,誰更具有獨特優(yōu)勢?非阿里云莫屬!

至于,阿里云的數據湖解決方案到底在哪些地方進行了重構?其實一句話就可以概括,那就是“云湖共生,數倉同步”。

云湖共生,數倉同步

“作為業(yè)內首個云原生、企業(yè)級數據湖解決方案,阿里云數據湖解決方案可提供EB級數據存儲、分析能力,能實現一站式湖存儲、湖加速、湖管理、湖計算,幫助企業(yè)深入挖掘與分析數據?!标惼瘀H強調,數據湖雖然是一個早已存在的概念,但阿里云的數據湖在繼承以往優(yōu)勢的基礎上已演繹出新的特色。

首先,最新數據湖解決方案要能承載移動、互聯(lián)網、IoT業(yè)務的生產數據。數據湖不應該只是解決分析環(huán)節(jié)的問題,而是要和生產環(huán)境結合。尤其在現代業(yè)務環(huán)境下,很多企業(yè)的大部分數據都來源于移動應用或者社交媒體,這種數據搬到分析引擎上,通常都是PB級別,如果等搬完后再分析,已不具備實時性。

所以,真正的數據湖解決方案必須基于企業(yè)級的生產環(huán)境做大數據分析,在線生成環(huán)境產生的數據,直接可以分析。其次,必須是一個能承載EB級數據量的數據湖。其三,具有秒級響應能力,有SLA的保證,能滿足高性能和高彈性需求。其四,能對數據加密,并對數據高效管理,確保業(yè)務安全。

如何理解這些能力呢?其實一切都是客戶應用價值驅動。比如:五年前,你問一個客戶,建了一個多大量的數據湖?用來干什么?他會說,有多少個TB,主要功能就是每天晚上做數據分析,等早晨把數據分析的結果打印出來,給領導看,用于當天決策。

但是五年后的今天,很多分析都是PB級,領導需要實時看到分析結果。如何讓生產環(huán)境具有高度的彈性和穩(wěn)定性?如何讓數據分析和業(yè)務保持強耦合狀態(tài)?一定要有SLA的保證!另外,數據是企業(yè)最寶貴的資源,必須要安全地存放,統(tǒng)一管理。

基于客戶應用場景的最新需求,阿里云在底層技術以及整體架構上進行了四個方面的重構。

阿里云提供了全球領先的、最高水平的SLA,引領對象存儲可用性SLA進入5位數。阿里云承諾,在每十萬次請求中,單可用區(qū)錯誤概率不超過10次,多可用區(qū)錯誤概率不超過5次,這比其他云廠商提供的服務提高了10-20倍的可用性。同時,最多有12個9的持久性設計,有多層的冗余架構設計和主動排查故障的能力。

能支持全球數十EB級數據規(guī)模。在阿里云的數據湖應用場景中,每天有上萬億次的讀

寫或者API調用請求,因為數據量非常大,通常會分標準型、低頻訪問型、歸檔型,用戶可以按數據類型分類。同時,數據架構也是強一致性模型,用戶可以做全生命周期管理,系統(tǒng)會提供Bucket清單,方便企業(yè)盤點、查找資源。所以,用戶如果使用阿里云的數據湖解決方案,等于在用上EB別的數據管理功能去管理企業(yè)的數據。

用戶可以靈活、更具彈性地選擇計算引擎。在算力方面,阿里云承諾在單客戶、單可用區(qū)3分鐘提供50萬核vCPU交付能力。在存儲上,阿里云可以提供上TB級別的數據吞吐量,同時有海量數據的處理能力。在現實業(yè)務環(huán)境中,企業(yè)應用往往遭遇巨大的性能挑戰(zhàn),如果有一個資源爆掉,其他資源會受影響。比如:在一個Bucket里面,可能會有很多業(yè)務在同時分析,會互相干擾。

即使只有一個業(yè)務在分析,也有腳本的優(yōu)先級。為了從性能方面保障高可用性,阿里云提供了同Bucket分業(yè)務的QoS性能隔離功能,滿足客戶不同業(yè)務分析需求。最重要的是,不管是機器學習引擎還是深度學習引擎,都可以自然接入阿里云OSS, 讓一份數據用于多個計算引擎。

數據安全。很多人擔心上云后數據不安全。實際上,只有上云后數據才安全。在阿里云上,只需點擊幾個按鈕,就可以全鏈路加密云上數據,并且密鑰可管可控,你可以集成阿里云的密鑰管理服務,也可以集成自己的KMS服務,系統(tǒng)支持多種加密算法。

另外,云上數據加密,不能影響性能,還要有防誤刪、自帶DDoS攻擊防護功能。可能有人會問,那萬一阿里的人干了什么壞事,怎么辦?這點無需擔心!阿里云資源的所有操作,都通過日志這種不能篡改的方式記錄,并且阿里內部對用戶資源的日志可以實現對外透明化,你可以通過第三方審計來核實。

值得一提的是,為了更好地提升客戶體驗,阿里云圍繞數據湖解決方案推出了一系列新產品。比如:對象存儲OSS加速器功能,主要用于數據湖重復復讀場景,能極大地解決讀吞吐挑戰(zhàn),從根本上解決數據讀取的一致性問題。

同時,阿里云針對對象存儲OSS,還重磅發(fā)布了冷歸檔存儲類型產品,提供接近磁帶級的成本,并解決磁帶方案在兼容性、數據失效、取回效率低等的問題,是海量數據長期留存的最佳解決方案。另外,在構建數據洞察力方面,開源Spark性能差,資源成本較高,阿里云最新發(fā)布的Databricks數據洞察產品內置了商業(yè)版的Spark和DataLake,可以為用戶帶來高于開源Spark50倍的性能計算能力,確保結構化數據、半結構化數據以及流式數據處理的高性能、高可靠和彈性擴展。

目前,阿里云最新推出的數據湖解決方案已經在互聯(lián)網、金融、教育、游戲等技術前沿領域落地,尤其在人工智能、物聯(lián)網、自動駕駛等擁有海量數據場景的新興行業(yè),未來大有廣闊空間。另外,混合云趨勢的到來,也會加速推動數據湖解決方案的落地。

公共云+私有云的結合,導致很多企業(yè)會把一部分數據遷移到云端,因為相對于IDC架構,云更有彈性、技術創(chuàng)新更快,企業(yè)成本更低、業(yè)務迭代可以更敏捷。同時,隨著業(yè)務數字化、在線化,數據的容災保護更加重要,企業(yè)會更重視對生產環(huán)境的災備。而從降本增效的角度考慮,企業(yè)也更愿意對數據進行冷熱分層,把一部分數據留在本地,把剩余的數據放在云端,然后在云上可以基于大數據、AI來做訓練和分析。

總體來看,數據湖的未來發(fā)展前景更加可期,而隨著企業(yè)應用上云進程的加快,阿里云將勇往直前,秒殺所有對手!

責任編輯:xj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 互聯(lián)網

    關注

    55

    文章

    11339

    瀏覽量

    110005
  • 數據中心
    +關注

    關注

    18

    文章

    5660

    瀏覽量

    75050
  • 阿里云
    +關注

    關注

    3

    文章

    1038

    瀏覽量

    45739
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Altera攜手生態(tài)伙伴推動下一代先進無線電系統(tǒng)發(fā)展

    在 2026 世界移動通信大會(MWC 2026)上,作為全球最大專注于 FPGA 的解決方案提供商,Altera 展示了其如何與生態(tài)伙伴攜手,通過可編程創(chuàng)新推動下一代先進無線電系統(tǒng)發(fā)展。
    的頭像 發(fā)表于 03-02 15:53 ?503次閱讀

    探索MAX25252:下一代相機傳感器的理想電源管理解決方案

    探索MAX25252:下一代相機傳感器的理想電源管理解決方案 在當今的汽車電子領域,相機傳感器的應用越來越廣泛,如環(huán)視攝像頭、后視攝像頭、側視攝像頭和前視攝像頭等。這些攝像頭對電源管理的要求也愈發(fā)
    的頭像 發(fā)表于 02-06 10:50 ?181次閱讀

    LitePoint與高通合作加速下一代Wi-Fi 8創(chuàng)新

    無線測試解決方案先進供應商LitePoint宣布,已使用其行業(yè)先進的LitePoint IQxel-MX平臺,實現高通技術公司的下一代Wi-Fi 8物理層(PHY)驗證。這里程碑標志
    的頭像 發(fā)表于 01-12 17:24 ?1302次閱讀

    SK海力士在CES 2026展示面向AI的下一代存儲器解決方案

    SK海力士(或‘公司’)6日宣布,公司將于當地時間1月6日至9日,在美國拉斯維加斯舉辦的“CES 2026”威尼斯人會展中心設立專屬客戶展館,并集中展示面向AI的下一代存儲器解決方案
    的頭像 發(fā)表于 01-08 12:57 ?1835次閱讀

    Amphenol Multi-Trak?:下一代高速互連解決方案

    Amphenol Multi-Trak?:下一代高速互連解決方案 在高速互連技術不斷發(fā)展的今天,Amphenol推出的Multi - Trak?產品無疑是顆耀眼的新星。它為電子工程師
    的頭像 發(fā)表于 12-11 15:30 ?436次閱讀

    Amphenol PCI Express? Gen 6 卡邊緣連接器:下一代系統(tǒng)的高速解決方案

    Amphenol PCI Express? Gen 6 卡邊緣連接器:下一代系統(tǒng)的高速解決方案 在電子設備不斷追求更高性能和更快數據傳輸速度的今天,連接器作為數據傳輸的關鍵部件,其性能
    的頭像 發(fā)表于 12-10 15:25 ?557次閱讀

    Amphenol PCIe? Gen 6 Mini Cool Edge IO連接器:下一代高速互連解決方案

    Amphenol PCIe? Gen 6 Mini Cool Edge IO連接器:下一代高速互連解決方案 在高速互連領域,Amphenol推出的PCIe? Gen 6 Mini Cool Edge
    的頭像 發(fā)表于 12-10 11:10 ?497次閱讀

    Amphenol RaptorLink 64X50 SOSA以太網交換機:下一代網絡解決方案

    Amphenol RaptorLink 64X50 SOSA以太網交換機:下一代網絡解決方案 在當今高速發(fā)展的電子科技領域,網絡設備的性能和可靠性至關重要。Amphenol的RaptorLink
    的頭像 發(fā)表于 12-10 10:25 ?388次閱讀

    羅姆面向下一代800 VDC架構發(fā)布電源解決方案白皮書

    ROHM(羅姆半導體)宣布,作為半導體行業(yè)引領創(chuàng)新的主要企業(yè),發(fā)布基于下一代800 VDC架構的AI數據中心用的先進電源解決方案白皮書。 本白皮書作為2025年6月發(fā)布的“羅姆為英偉達800V
    的頭像 發(fā)表于 11-04 16:45 ?757次閱讀

    安森美SiC器件賦能下一代AI數據中心變革

    電源解決方案。特別是近期,安森美攜手英偉達,共推下一代AI數據中心加速向800V直流供電方案轉型,這種技術能力的廣度和深度使安森美成為少數能
    的頭像 發(fā)表于 10-31 13:47 ?767次閱讀

    下一代100T網絡交換拓撲 | Marvell與Samtec聯(lián)合推出卓越解決方案

    Samtec近期在2025年光纖通信會議及展覽(OFC 2025)上發(fā)布了款突破性的下一代100T網絡交換拓撲,該拓撲在基板層面 集成了Samtec的共封裝連接方案
    的頭像 發(fā)表于 10-17 16:32 ?4180次閱讀
    <b class='flag-5'>下一代</b>100T網絡交換拓撲 | Marvell與Samtec聯(lián)合推出卓越<b class='flag-5'>解決方案</b>

    Flex Power Modules將與瑞薩電子合作推出下一代電源管理解決方案

    的CPU、GPU、FPGA、ASIC和加速器卡推出下一代板載電源管理解決方案。 瑞薩電子的性能算力部門副總裁Tom Truman對此表示:"通過將我們最新一代的智能功率級與Flex Power
    的頭像 發(fā)表于 09-17 22:52 ?593次閱讀

    適用于下一代 GGE 和 HSPA 手機的多模/多頻段 PAM skyworksinc

    電子發(fā)燒友網為你提供()適用于下一代 GGE 和 HSPA 手機的多模/多頻段 PAM相關產品參數、數據手冊,更有適用于下一代 GGE 和 HSPA 手機的多模/多頻段 PAM的引腳圖、接線圖、封裝
    發(fā)表于 09-05 18:34
    適用于<b class='flag-5'>下一代</b> GGE 和 HSPA 手機的多模/多頻段 PAM skyworksinc

    安森美攜手英偉達推動下一代AI數據中心發(fā)展

    安森美(onsemi,美國納斯達克股票代號:ON)宣布與英偉達(NVIDIA)合作,共同推動向800V直流(VDC)供電架構轉型。這變革性解決方案將推動下一代人工智能(AI)數據中心
    的頭像 發(fā)表于 08-06 17:27 ?1509次閱讀

    下一代高速銅纜鐵氟龍發(fā)泡技術

    為什么下一代高速銅纜需要鐵氟龍發(fā)泡技術在人工智能與萬物互聯(lián)的雙重驅動下,全球數據傳輸速率正經歷場“超速進化”。AI大模型的參數規(guī)模突破萬億級,
    的頭像 發(fā)表于 03-13 09:00 ?1394次閱讀
    <b class='flag-5'>下一代</b>高速銅纜鐵氟龍發(fā)泡<b class='flag-5'>技術</b>