91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Spark SQL性能實(shí)現(xiàn)17.7倍的提升,是如何做到的

獨(dú)愛(ài)72H ? 來(lái)源:砍柴網(wǎng) ? 作者:砍柴網(wǎng) ? 2019-11-14 16:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來(lái)源:砍柴網(wǎng))

Apache Spark是專(zhuān)為大規(guī)模數(shù)據(jù)處理而設(shè)計(jì)的快速通用的計(jì)算引擎,常用來(lái)構(gòu)建大型、低延遲的數(shù)據(jù)分析應(yīng)用程序。Spark一個(gè)主要特點(diǎn)在于,其能夠在內(nèi)存中進(jìn)行計(jì)算,這使得其數(shù)據(jù)分析效率往往高于其它計(jì)算引擎,但是,服務(wù)器內(nèi)存資源的限制也使得其性能的擴(kuò)展存在著一定的瓶頸,在超大規(guī)模負(fù)載中無(wú)法充分發(fā)揮其利用內(nèi)存進(jìn)行計(jì)算的性能優(yōu)勢(shì)。

某全球領(lǐng)先的語(yǔ)音識(shí)別服務(wù)提供商是最早將Spark應(yīng)用到生產(chǎn)環(huán)境的團(tuán)隊(duì)之一,該公司的語(yǔ)音云通過(guò)幾千臺(tái)服務(wù)器構(gòu)成的云計(jì)算平臺(tái)向用戶(hù)提供多樣的、實(shí)時(shí)語(yǔ)音處理能力,日均服務(wù)終端用戶(hù)超過(guò)15億,日增數(shù)據(jù)超過(guò)100TB。2014年該公司基于Spark和AI技術(shù)構(gòu)建了DMP大數(shù)據(jù)平臺(tái)(用戶(hù)數(shù)據(jù)管理平臺(tái))。DMP平臺(tái)的主要功能就是收集、存儲(chǔ)、分析和挖掘龐大的用戶(hù)數(shù)據(jù),以實(shí)現(xiàn)廣告精準(zhǔn)投放。

Spark在該公司的大數(shù)據(jù)平臺(tái)中主要用于海量用戶(hù)數(shù)據(jù)分析,每天支撐穩(wěn)定運(yùn)行的Spark SQL統(tǒng)計(jì)分析指標(biāo)和SQL腳本有幾千個(gè)。但是在將Spark SQL用于海量用戶(hù)數(shù)據(jù)分析的過(guò)程中,仍然面臨著一些痛點(diǎn),這些都限制了該公司語(yǔ)音云的數(shù)據(jù)分析能力。

Spark的性能不僅受到CPU、內(nèi)存、網(wǎng)絡(luò)、磁盤(pán)等硬件設(shè)備的制約,而且Spark SQL目前還不支持索引,也嚴(yán)重影響了Spark SQL在進(jìn)行大規(guī)模數(shù)據(jù)分析時(shí)的性能,索引能夠提升數(shù)據(jù)檢索的效率,降低硬盤(pán)的IO瓶頸。

隨著數(shù)據(jù)量越來(lái)越大,即席分析的需求越來(lái)越強(qiáng)烈,即席查詢(xún)是用戶(hù)根據(jù)用戶(hù)自己的需求,靈活選擇查詢(xún)條件,系統(tǒng)能夠根據(jù)用戶(hù)的選擇生成響應(yīng)的統(tǒng)計(jì)報(bào)表和結(jié)果集;在數(shù)據(jù)倉(cāng)庫(kù)和大數(shù)據(jù)分析系統(tǒng)中,即席查詢(xún)使用的越多,對(duì)系統(tǒng)的性能要求也就越高,如果內(nèi)存能夠緩存更多的熱點(diǎn)數(shù)據(jù),能夠極大的提升即席查詢(xún)處理速度并降低響應(yīng)延遲。

數(shù)據(jù)既有隨機(jī)讀的需求(即席查詢(xún)-Ad-hoc),又有全表掃描的需求(機(jī)器學(xué)習(xí));機(jī)器學(xué)習(xí)就是通過(guò)特定算法從海量的歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而對(duì)新的樣本進(jìn)行分析并對(duì)未來(lái)做出預(yù)測(cè),在模型訓(xùn)練的過(guò)程中會(huì)產(chǎn)生大量的中間結(jié)果數(shù)據(jù),通常情況下需要將中間結(jié)果數(shù)據(jù)持久化到文件系統(tǒng)上,如果內(nèi)存能夠緩存更多的中間結(jié)果數(shù)據(jù),可以提升模型訓(xùn)練的速度。
(責(zé)任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 互聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    55

    文章

    11343

    瀏覽量

    110153
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1313

    瀏覽量

    25778
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    北大團(tuán)隊(duì)最新研究:AI芯片算力提升數(shù)倍,能效提升超90

    首次實(shí)現(xiàn)后摩爾新器件異質(zhì)集成的多物理域融合傅里葉變換系統(tǒng)。 ? 這一全新計(jì)算架構(gòu)將傅里葉變換計(jì)算速度從當(dāng)前每秒約1300億次提升至每秒約5000億次,算力提升近4,能效
    的頭像 發(fā)表于 01-15 09:31 ?2068次閱讀

    全新軟件與模型優(yōu)化為NVIDIA DGX Spark注入強(qiáng)大動(dòng)力

    自發(fā)布以來(lái),NVIDIA 通過(guò)持續(xù)的軟件優(yōu)化以及與軟件合作伙伴和開(kāi)源社區(qū)的緊密協(xié)作,不斷提升基于 Grace Blackwell 架構(gòu)的 DGX Spark性能。這些舉措在推理、訓(xùn)練和創(chuàng)意工作流方面都取得了顯著的成效。
    的頭像 發(fā)表于 01-09 10:17 ?665次閱讀

    17.7 GHz - 19.7 GHz低噪聲放大器ADL5725:特性、應(yīng)用與設(shè)計(jì)要點(diǎn)

    Devices推出的ADL5725,一款針對(duì)17.7 GHz - 19.7 GHz微波頻段優(yōu)化的窄帶、高性能低噪聲放大器。 文件下載: ADL5725.pdf 一、ADL5725的特性亮點(diǎn) 1.
    的頭像 發(fā)表于 01-05 16:10 ?247次閱讀

    如何在DGX Spark上運(yùn)行NVIDIA Omniverse

    首先感謝 Vigor 同學(xué)第一時(shí)間的分享,以下是具體如何在 DGX Spark 上運(yùn)行 Omniverse 的方法。
    的頭像 發(fā)表于 12-17 10:13 ?729次閱讀
    如何在DGX <b class='flag-5'>Spark</b>上運(yùn)行NVIDIA Omniverse

    性能提升30:當(dāng)AI存儲(chǔ)沖刺“秒速”,誰(shuí)為它的“出廠(chǎng)體檢”按下快門(mén)?

    SK 海力士與英偉達(dá)合作研發(fā)性能提升 30 的 AI NAND,凸顯現(xiàn)有測(cè)試驗(yàn)證體系的 “代差” 危機(jī)。傳統(tǒng)測(cè)試難以滿(mǎn)足極端負(fù)載下的精準(zhǔn)性能檢測(cè),面臨接口帶寬延遲、信號(hào)完整性、負(fù)載真
    的頭像 發(fā)表于 12-15 14:17 ?390次閱讀

    亞馬遜發(fā)布新一代AI芯片Trainium3,性能提升4

    Trainium 4的開(kāi)發(fā)計(jì)劃。亞馬遜表示,這款芯片能夠比英偉達(dá)市場(chǎng)領(lǐng)先的圖形處理單元(GPU)更便宜、更高效地驅(qū)動(dòng)AI模型背后的密集計(jì)算。 ? ? 作為亞馬遜首款3納米工藝AI芯片,Trainium3的核心突破在于性能、能效與擴(kuò)展性的全面躍升。其計(jì)算性能較前代Train
    的頭像 發(fā)表于 12-09 08:37 ?8673次閱讀
    亞馬遜發(fā)布新一代AI芯片Trainium3,<b class='flag-5'>性能</b><b class='flag-5'>提升</b>4<b class='flag-5'>倍</b>

    使用NVIDIA Nemotron RAG和Microsoft SQL Server 2025構(gòu)建高性能AI應(yīng)用

    搜索和調(diào)用外部 AI 模型的 SQL 原生 API。NVIDIA 與微軟共同將 SQL Server 2025 與 NVIDIA Nemotron RAG 開(kāi)放模型集合無(wú)縫連接,這使您能夠在云端或本地環(huán)境中基于自己的數(shù)據(jù)構(gòu)建高性能
    的頭像 發(fā)表于 12-01 09:31 ?870次閱讀
    使用NVIDIA Nemotron RAG和Microsoft <b class='flag-5'>SQL</b> Server 2025構(gòu)建高<b class='flag-5'>性能</b>AI應(yīng)用

    NVIDIA DGX Spark快速入門(mén)指南

    NVIDIA DGX Spark 已正式向 AI 開(kāi)發(fā)者交付,對(duì)于剛?cè)胧值娜?DGX Spark,該如何進(jìn)行初始化設(shè)置?本篇文章將引導(dǎo)您完成 DGX Spark 首次設(shè)置。在初始設(shè)置的過(guò)程中,您
    的頭像 發(fā)表于 11-17 14:11 ?6356次閱讀
    NVIDIA DGX <b class='flag-5'>Spark</b>快速入門(mén)指南

    不用編程不用聯(lián)網(wǎng),實(shí)現(xiàn)福(BECKHOFF)PLC對(duì)接SQL數(shù)據(jù)庫(kù),上報(bào)和查詢(xún)數(shù)據(jù)的案例

    的數(shù)值;查看過(guò)程數(shù)據(jù)(工具->網(wǎng)關(guān)數(shù)據(jù)監(jiān)控):顯示當(dāng)前任務(wù)組對(duì)應(yīng)的過(guò)程數(shù)據(jù), 即SQL語(yǔ)句。 福PLC內(nèi)需要添加智能網(wǎng)關(guān)的IP地址,同時(shí)要確認(rèn)PLC的AMS ID,AMS網(wǎng)絡(luò)端口等參數(shù)
    發(fā)表于 10-10 11:14

    SQL 通用數(shù)據(jù)類(lèi)型

    SQL 通用數(shù)據(jù)類(lèi)型 數(shù)據(jù)庫(kù)表中的每個(gè)列都要求有名稱(chēng)和數(shù)據(jù)類(lèi)型。Each column in a database table is required to have a name and a
    的頭像 發(fā)表于 08-18 09:46 ?758次閱讀

    Text2SQL準(zhǔn)確率暴漲22.6%!3大維度全拆

    基于 BIRD 數(shù)據(jù)集展開(kāi)。 方法:提出 J-Schema 呈現(xiàn)數(shù)據(jù)庫(kù)結(jié)構(gòu)并合理提供示例值,結(jié)合思維鏈引導(dǎo)模型推理。采用 Iterative DPO 迭代訓(xùn)練,多輪迭代提升性能。用自洽性方法,通過(guò)硬 / 軟投票從多個(gè)候選答案中選最優(yōu),軟投票更優(yōu)。 結(jié)果:解決 Text2
    的頭像 發(fā)表于 08-14 11:17 ?750次閱讀
    Text2<b class='flag-5'>SQL</b>準(zhǔn)確率暴漲22.6%!3大維度全拆

    Arm KleidiAI與XNNPack集成實(shí)現(xiàn)AI性能提升

    INT4 矩陣乘法 (matmul) 優(yōu)化以增強(qiáng) Google Gemma 2 模型性能開(kāi)始,到后續(xù)完成多項(xiàng)底層技術(shù)增強(qiáng),Arm 在 XNNPack 上實(shí)現(xiàn)了顯著的性能提升。
    的頭像 發(fā)表于 08-08 15:19 ?2952次閱讀
    Arm KleidiAI與XNNPack集成<b class='flag-5'>實(shí)現(xiàn)</b>AI<b class='flag-5'>性能</b><b class='flag-5'>提升</b>

    快手上線(xiàn)鴻蒙應(yīng)用高性能解決方案:數(shù)據(jù)反序列化性能提升90%

    普通對(duì)象(如 JSON 數(shù)據(jù))與類(lèi)實(shí)例進(jìn)行互轉(zhuǎn),是實(shí)現(xiàn)面向?qū)ο缶幊膛c數(shù)據(jù)序列化解耦的核心工具。隨著業(yè)務(wù)復(fù)雜度的提升,該庫(kù)在反序列化過(guò)程中逐漸暴露出性能瓶頸,影響用戶(hù)核心體驗(yàn)。因此
    發(fā)表于 05-15 10:01

    艾體寶案例 9?測(cè)試效率 + 67%?成本下降,Boohoo 做對(duì)了什么?

    作為全球領(lǐng)先的線(xiàn)上時(shí)尚零售商,Boohoo 集團(tuán)在業(yè)務(wù)快速擴(kuò)張的過(guò)程中,原有的測(cè)試體系面臨著成本高、擴(kuò)展難等挑戰(zhàn)。通過(guò)引入 LambdaTest 云端測(cè)試平臺(tái),Boohoo 成功實(shí)現(xiàn)了測(cè)試自動(dòng)化、設(shè)備覆蓋率提升和顯著的成本控制。本案例將帶你了解他們是
    的頭像 發(fā)表于 05-08 10:52 ?549次閱讀

    1.9性能提升!英特爾至強(qiáng)6在MLPerf基準(zhǔn)測(cè)試中表現(xiàn)卓越

    關(guān)鍵項(xiàng)目中,性能表現(xiàn)卓越。測(cè)試結(jié)果顯示,相較于上一代產(chǎn)品,該處理器的AI性能實(shí)現(xiàn)了高達(dá)1.9的顯著提升,這也充分顯示了至強(qiáng)6處理器作為現(xiàn)代
    的頭像 發(fā)表于 04-07 10:58 ?726次閱讀