91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

怎么評估算法的性能

深度學(xué)習(xí)自然語言處理 ? 來源:CS的陋室 ? 作者:CS的陋室 ? 2022-08-11 10:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我在很多文章里都有吐槽大規(guī)模預(yù)訓(xùn)練模型的性能差,落地成本高,這一期就和大家講講,怎么評估算法的性能的。

當(dāng)然,這篇文章應(yīng)該是比較科普的,主要是為了讓大家樹立一個性能意識,在進(jìn)行方案選型和最終檢測的時候,能有關(guān)注性能的這個意識。

性能的意義

這里所謂的性能,本質(zhì)是對執(zhí)行速度、執(zhí)行資源消耗的一種評估。在現(xiàn)實的落地場景,一個模型最終能不能用起來,除了和算法效果有關(guān),即類似準(zhǔn)確率召回率,還和依賴的資源以及速度是相關(guān)的。

我們可以把運行環(huán)境比作一個空間有限的房間,如果你的刀是40米長的,其實很難在這個房間里使的舒服,即使他的傷害很高很強,與之相反,一把短一些的到在有限空間內(nèi),用起來會更得心應(yīng)手。這就是性能的意義,在預(yù)訓(xùn)練模型逐步熱門之后,這個問題會更加尖銳,預(yù)訓(xùn)練無論是計算復(fù)雜度,還是空間需求,都很大,先不說訓(xùn)練,就是推理,單機推理還算可以,但是耗時,還是高并發(fā)需求下,并非所有的組織都能支持,因此,我們需要對性能有足夠的敏感性,否則會很可能會出現(xiàn),一頓操作效果調(diào)優(yōu)一個月的預(yù)訓(xùn)練模型,最終因為上不了線功虧一簣的尷尬情況,當(dāng)然,這也是作為一名算法工程師,必備的一種能力。

性能評估的觀測指標(biāo)

要評估性能好壞,有哪些評估項,又有那些評估指標(biāo),詳細(xì)介紹下。

首先是單機速度的評估。即單進(jìn)程下,每次推理所需要的時間,或者單位時間下能處理的計算次數(shù),一般評估的是rt(Reaction Time,響應(yīng)時間)或者qps/tps(query per second,transaction per second)。但是,由于很多時候,不同的輸入可能會影響這個時間,所以一般使用和在線分布接近的樣本或者query來批量請求,求平均值,而常見的,耗時長度的分布服從二八法則,因此我們要關(guān)注的是TOP耗時的情況,因此我們還會看不同位置的分位點情況,例如90%、95%或者99%分位點。另外還有種評估的方式,用合格率之類的方法,例如最高耗時不能超過200ms,超過的算失敗,然后計算成功率,成功率99%以上。

對于互聯(lián)網(wǎng)環(huán)境,除了單機速度,還必須考慮并發(fā)能力,并發(fā)能力是指當(dāng)同時很多請求同時或者接近同時請求的時候的性能狀態(tài),很多時候,因為熱點事件的出現(xiàn),大家會大量開始在網(wǎng)上檢索請求,對計算機而言,完不成的任務(wù)就會開始排隊(這個和銀行柜臺類似的),排隊太長系統(tǒng)自然就難堪重負(fù)崩潰了,例如微博、B站、知乎這種偶爾的崩潰就很多是因為這個原因。指標(biāo)上,其實更多是和單機的評估類似,只是評估的時候,一般是用多進(jìn)程同時請求以模擬在線情況,例如4進(jìn)程、8進(jìn)程這種,然后來看速度還能不能保證在合格范圍內(nèi)。

除了速度之外,偶爾還要看看其他的問題,例如內(nèi)存,有沒有內(nèi)存泄漏(在服務(wù)運行期間內(nèi)存有沒有持續(xù)增加),在高峰期內(nèi)存是否在正常范圍內(nèi)(例如80%以內(nèi)),都是需要關(guān)注的。

從批跑到壓測

前面有提到,評估性能最簡單的方式就是批量跑case,簡單的性能評估,其實就是找一批和query批量跑,然后掐時間。這里,先說下這個query需要有什么要求:

數(shù)量得足夠,否則均值和分位點計算就達(dá)不到統(tǒng)計意義。

而且盡可能和現(xiàn)實場景匹配,這樣測得時間和在線實際時間比較接近(這個其實沒那么難,直接撈日志抽樣即可)

這個時間的評估其實不難,簡單的用tqdm,上面就顯示平均時間(X item/s),但是如果要算分位點了,肯定要把每個case的時間都記錄下來再統(tǒng)計,例如弄numpy里面的函數(shù)計算,寫起來并不算困難。

但是,一旦要考慮并發(fā)能力了,那就要壓測了,即壓力測試,所謂的壓測,其實就是計算機模擬N個用戶,同時不斷向服務(wù)發(fā)送請求,當(dāng)然,要壓測的話,通常需要把模型打包成服務(wù),例如grpc或者h(yuǎn)ttp的。然后和觀測上面提的指標(biāo),耗時、qps、成功率、內(nèi)存等。一般情況,我們不需要用所有服務(wù)器來實驗,一般也是對一臺機器即可,因為多臺機器,如果有做負(fù)載均衡,其實性能就是多臺機器求和而已。python實現(xiàn)上,先是對模型打包成服務(wù)形成服務(wù)端,而壓測腳本這邊寫一個客戶端來請求服務(wù)端,上壓測的話就弄個多進(jìn)程觸發(fā)即可,網(wǎng)上有很多樣例代碼,直接搜,當(dāng)然別指望能照搬,肯定是需要自己服務(wù)的情況來修改額,畢竟接口不盡相同。

小結(jié)

本文給大家簡單介紹了算法這邊需要關(guān)注的性能,以及評估的主要方式,能讓大家對性能樹立一個基本的概念,讓大家清楚性能是什么,怎么觀測等,后續(xù)會給大家介紹一些性能調(diào)優(yōu)的手段,幫助大家更好地優(yōu)化性能,成功把自己心心念念的模型推上線。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 互聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    55

    文章

    11339

    瀏覽量

    110000
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4784

    瀏覽量

    98099
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3757

    瀏覽量

    52130

原文標(biāo)題:算法性能評估指南

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    RC38208A評估板:高性能時鐘綜合與抖動衰減評估利器

    RC38208A評估板:高性能時鐘綜合與抖動衰減評估利器 在電子設(shè)計領(lǐng)域,時鐘綜合器和抖動衰減器的性能對系統(tǒng)的穩(wěn)定性和可靠性起著關(guān)鍵作用。Renesas的RC38208A
    的頭像 發(fā)表于 12-26 18:10 ?1092次閱讀

    深入解析RC38312A評估板:高性能時鐘解決方案的探索

    深入解析RC38312A評估板:高性能時鐘解決方案的探索 在電子設(shè)計領(lǐng)域,時鐘信號的穩(wěn)定性和準(zhǔn)確性對于系統(tǒng)的性能至關(guān)重要。Renesas的 RC38312A 評估板(EVB)為工程師們
    的頭像 發(fā)表于 12-26 17:50 ?697次閱讀

    探索RTKA271082DE0000BU評估板:性能、操作與設(shè)計要點

    探索RTKA271082DE0000BU評估板:性能、操作與設(shè)計要點 在汽車電子領(lǐng)域,電源管理芯片(PMIC)的性能對于各類車載應(yīng)用的穩(wěn)定運行至關(guān)重要。RTKA271082DE0000BU評估
    的頭像 發(fā)表于 12-26 17:25 ?552次閱讀

    如何估算電源線承受的電流?

    ,如何科學(xué)合理地估算電源線的電流承載能力呢?這需要從導(dǎo)線材質(zhì)、截面積、敷設(shè)環(huán)境、絕緣材料等多個維度綜合分析。 一、導(dǎo)線材質(zhì)與電流承載的基礎(chǔ)關(guān)系 導(dǎo)線的導(dǎo)電性能主要由其材質(zhì)決定,常見的有銅和鋁兩種。銅的導(dǎo)電率約為5
    的頭像 發(fā)表于 12-18 07:45 ?1383次閱讀

    如何估算焊錫膏的印刷量?

    估算焊錫膏的印刷量是表面貼裝技術(shù)(SMT)中的關(guān)鍵環(huán)節(jié),直接影響焊接質(zhì)量和成本。以下是分步驟的估算方法及關(guān)鍵注意事項:
    的頭像 發(fā)表于 11-26 09:06 ?598次閱讀
    如何<b class='flag-5'>估算</b>焊錫膏的印刷量?

    BLDC與PMSM電機控制算法的聯(lián)系與區(qū)別

    降低了硬件成本和傳感器故障風(fēng)險,但存在技術(shù)門檻高、位置估算有延遲和誤差、動態(tài)響應(yīng)性能不及帶傳感器FOC等缺點。其控制精度和魯棒性通常介于六步換相法和有傳感器FOC之間。 三、 算法與電機的典型搭配
    發(fā)表于 10-27 09:23

    如何估算ADC的總轉(zhuǎn)換時間?

    如何估算ADC的總轉(zhuǎn)換時間?
    發(fā)表于 08-25 07:09

    請問如何估算ADC的總轉(zhuǎn)換時間?

    如何估算ADC的總轉(zhuǎn)換時間?
    發(fā)表于 08-21 08:27

    無感FOC算法在電機啟動時具體如何優(yōu)化性能?--【其利天下】

    在現(xiàn)代電機控制系統(tǒng)中,無感FOC(磁場定向控制)算法因其卓越的性能表現(xiàn)而備受關(guān)注。尤其是在電機啟動階段,無感FOC算法通過一系列優(yōu)化措施,極大地提升了電機的啟動性能。本文將詳細(xì)探討無感
    的頭像 發(fā)表于 08-08 18:38 ?1540次閱讀
    無感FOC<b class='flag-5'>算法</b>在電機啟動時具體如何優(yōu)化<b class='flag-5'>性能</b>?--【其利天下】

    如何評估協(xié)議分析儀的性能指標(biāo)?

    評估協(xié)議分析儀的性能指標(biāo)需從硬件處理能力、協(xié)議解析精度、實時響應(yīng)效率、擴展性與兼容性、用戶體驗五大維度綜合考量。以下是具體指標(biāo)及評估方法,結(jié)合實際場景說明其重要性:一、硬件處理能力:決定基礎(chǔ)
    發(fā)表于 07-18 14:44

    【Banana Pi BPI-RV2開發(fā)板試用體驗】移植音頻處理算法回聲消除降噪性能等效果評估

    一. 前言 雖然香蕉派 BPI-RV2 RISC-V 開發(fā)板主打路由器開發(fā),但是其強勁的性能,所以進(jìn)行實時音頻處理等應(yīng)用也是小菜一碟。 本文分享移植音頻處理算法,評估算法運行效率,評估
    發(fā)表于 07-09 23:19

    VirtualLab:F-Theta掃描透鏡的性能評估

    Detector 總結(jié)-組件 系統(tǒng)觀感 通過系統(tǒng):三維可視化,不同F(xiàn)oV模式可以通過顏色編碼來區(qū)分。此外,可以檢查場的軌跡,以便將探測器放置在正確的位置。 性能評估-點位偏差 性能評估
    發(fā)表于 05-29 08:48

    求助,關(guān)于iMX 8M Mini評估套件的疑問求解

    我們已經(jīng)購買了 iMX 8M Mini 評估套件,我們想了解軟件中的縮放功能。它將滿足我們的延遲和 FPS 要求。 1. iMX 芯片如何縮放視頻? 2. 視頻縮放有多種算法嗎?我們能知道分化因素
    發(fā)表于 03-25 06:47

    主驅(qū)電機系統(tǒng)的扭矩估算方案

    主驅(qū)電機是電動汽車核心的部件之一,主要作用是產(chǎn)生驅(qū)動扭矩或制動扭矩,驅(qū)動車輛前進(jìn)并進(jìn)行動能回收。扭矩估算算法也成為主驅(qū)電機扭矩安全的重點。目前常用的扭矩估算算法有三種,分別是:電流法、功率法和查表法。本文將就這三種算法進(jìn)行展開講
    的頭像 發(fā)表于 03-17 16:26 ?1091次閱讀
    主驅(qū)電機系統(tǒng)的扭矩<b class='flag-5'>估算</b>方案

    ?為什么GPU性能效率比峰值性能更關(guān)鍵

    評估GPU性能時,通常首先考察三個指標(biāo):圖形工作負(fù)載的紋理率(GPixel/s)、浮點運算次數(shù)(FLOPS)以及它們能處理計算和AI工作負(fù)載的每秒8-bittera運算次數(shù)(TOPS)。這些關(guān)鍵
    的頭像 發(fā)表于 03-13 08:34 ?908次閱讀
    ?為什么GPU<b class='flag-5'>性能</b>效率比峰值<b class='flag-5'>性能</b>更關(guān)鍵