91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

能快速找到代碼運行最慢部分的編程神器

Linux愛好者 ? 來源:Python七號 ? 作者:somenzz ? 2021-10-13 16:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

天下武功,唯快不破。

編程也不例外,你的代碼跑的快,你能快速找出代碼慢的原因,你的碼功就高。

今天分享一個超級實用的 Python 性能分析工具 pyinstrument ,可以快速找到代碼運行最慢的部分,幫助提高代碼的性能。支持 Python 3.7+ 且能夠分析異步代碼,僅需一條命令即可顯示具體代碼的耗時。經(jīng)常寫 Python 的小伙伴一定要用一下。

安裝

pipinstallpyinstrument

簡單的使用

在程序的開始,啟動 pyinstrument 的 Profiler,結(jié)束時關(guān)閉 Profiler 并打印分析結(jié)果如下:

frompyinstrumentimportProfiler

profiler=Profiler()
profiler.start()

#這里是你要分析的代碼

profiler.stop()

profiler.print()

比如這段代碼 123.py,我們可以清楚的看到是列表推導(dǎo)式比較慢:

frompyinstrumentimportProfiler

profiler=Profiler()
profiler.start()

#這里是你要分析的代碼
a=[iforiinrange(100000)]
b=(iforiinrange(100000))

profiler.stop()
profiler.print()

上述分析需要修改源代碼,如果你使用命令行工具,就不需要修改源代碼,只需要執(zhí)行 pyinstrument xxxx.py 即可:

比如有這樣一段排序的程序 c_sort.py:

importsys
importtime

importnumpyasnp

arr=np.random.randint(0,10,10)

defslow_key(el):
time.sleep(0.01)
returnel

arr=list(arr)

foriinrange(10):
arr.sort(key=slow_key)

print(arr)

這段代碼里面故意放了一句 time.sleep(0.01) 來延遲性能,看看 pyinstrument 能否識別,命令行執(zhí)行 pyinstrument c_sort.py:

從結(jié)果來看,程序運行了 1.313 秒,而 sleep 就運行了 1.219 秒,很明顯是瓶頸,現(xiàn)在我們把它刪除,再看看結(jié)果:

刪除之后,性能最慢的就是 numpy 模塊的初始化代碼 __init__.py了,不過這些代碼不是自己寫的,而且并不是特別慢,就不需要去關(guān)心了。

分析 Flask 代碼

Web 應(yīng)用也可以使用這個來找出性能瓶頸,比如 flask,只需要在請求之前記錄時間,在請求之后統(tǒng)計時間,只需要在 flask 的請求攔截器里面這樣寫:

fromflaskimportFlask,g,make_response,request
app=Flask(__name__)

@app.before_request
defbefore_request():
if"profile"inrequest.args:
g.profiler=Profiler()
g.profiler.start()

@app.after_request
defafter_request(response):
ifnothasattr(g,"profiler"):
returnresponse
g.profiler.stop()
output_html=g.profiler.output_html()
returnmake_response(output_html)

假如有這樣一個 API:

@app.route("/dosomething")
defdo_something():
importrequests
requests.get("http://google.com")
return"Googlesayshello!"

為了測試這個 API 的瓶頸,我們可以在 url 上加一個參數(shù) profile 就可以:http://127.0.0.1:5000/dosomething?profile,哪一行代碼執(zhí)行比較慢,結(jié)果清晰可見:

分析 Django 代碼

分析 Django 代碼也非常簡單,只需要在 Django 的配置文件的 MIDDLEWARE 中添加

"pyinstrument.middleware.ProfilerMiddleware",

然后就可以在 url 上加一個參數(shù) profile 就可以:

如果你不希望所有人都能看到,只希望管理員可以看到,settings.py 可以添加這樣的代碼:

defcustom_show_pyinstrument(request):
returnrequest.user.is_superuser

PYINSTRUMENT_SHOW_CALLBACK="%s.custom_show_pyinstrument"%__name__

如果不想通過 url 后面加參數(shù)的方式查看性能分析,可以在 settings.py 文件中添加:

PYINSTRUMENT_PROFILE_DIR='profiles'

這樣,每次訪問一次 Django 接口,就會將分析結(jié)果以 html 文件形式保存在 項目目錄下的 profiles 文件夾中。

分析異步代碼

簡單的異步代碼分析:

async_example_simple.py:

importasyncio

frompyinstrumentimportProfiler

asyncdefmain():
p=Profiler()
withp:
print("Hello...")
awaitasyncio.sleep(1)
print("...World!")
p.print()

asyncio.run(main())

復(fù)雜一些的異步代碼分析:

importasyncio
importtime

importpyinstrument

defdo_nothing():
pass

defbusy_wait(duration):
end_time=time.time()+duration

whiletime.time()ifprofile:
p=pyinstrument.Profiler()
p.start()

busy_wait(0.1)
sleep_start=time.time()
awaitasyncio.sleep(when)
print(f"sleptfor{time.time()-sleep_start:.3f}seconds")
busy_wait(0.1)

print(what)
ifprofile:
p.stop()
p.print(show_all=True)

loop=asyncio.get_event_loop()

loop.create_task(say("firsthello",2,profile=True))
loop.create_task(say("secondhello",1,profile=True))
loop.create_task(say("thirdhello",3,profile=True))

loop.run_forever()
loop.close()

工作原理

Pyinstrument 每 1ms 中斷一次程序,并在該點記錄整個堆棧。它使用 C 擴展名和 PyEval_SetProfile 來做到這一點,但只每 1 毫秒讀取一次讀數(shù)。你可能覺得報告的樣本數(shù)量有點少,但別擔(dān)心,它不會降低準確性。默認間隔 1ms 是記錄堆棧幀的下限,但如果在單個函數(shù)調(diào)用中花費了很長時間,則會在該調(diào)用結(jié)束時進行記錄。如此有效地將這些樣本“打包”并在最后記錄。

Pyinstrument 是一個統(tǒng)計分析器,并不跟蹤,它不會跟蹤您的程序進行的每個函數(shù)調(diào)用。相反,它每 1 毫秒記錄一次調(diào)用堆棧。與其他分析器相比,統(tǒng)計分析器的開銷比跟蹤分析器低得多。

比如說,我想弄清楚為什么 Django 中的 Web 請求很慢。如果我使用 cProfile,我可能會得到這個:

151940functioncalls(147672primitivecalls)in1.696seconds

Orderedby:cumulativetime

ncallstottimepercallcumtimepercallfilename:lineno(function)
10.0000.0001.6961.696profile:0(at0x1053d6a30,file"./manage.py",line2>)
10.0010.0011.6931.693manage.py:2()
10.0000.0001.5861.586__init__.py:394(execute_from_command_line)
10.0000.0001.5861.586__init__.py:350(execute)
10.0000.0001.1421.142__init__.py:254(fetch_command)
430.0130.0001.1240.026__init__.py:1()
3880.0080.0001.0620.003re.py:226(_compile)
1580.0050.0001.0480.007sre_compile.py:496(compile)
10.0010.0011.0421.042__init__.py:78(get_commands)
1530.0010.0001.0360.007re.py:188(compile)
106/1020.0010.0001.0300.010__init__.py:52(__getattr__)
10.0000.0001.0291.029__init__.py:31(_setup)
10.0000.0001.0211.021__init__.py:57(_configure_logging)
20.0020.0011.0110.505log.py:1()

看完是不是還是一臉懵逼,通常很難理解您自己的代碼如何與這些跟蹤相關(guān)聯(lián)。Pyinstrument 記錄整個堆棧,因此跟蹤昂貴的調(diào)用要容易得多。它還默認隱藏庫框架,讓您專注于影響性能的應(yīng)用程序/模塊:

_.___/_______/_Recorded:1435Samples:131
/_//_////_///_/////_'///Duration:3.131CPUtime:0.195
/_/v3.0.0b3

Program:examples/django_example/manage.pyrunserver--nothreading--noreload

3.131manage.py:2
└─3.118execute_from_command_linedjango/core/management/__init__.py:378
[473frameshidden]django,socketserver,selectors,wsgi...
2.836selectselectors.py:365
0.126_get_responsedjango/core/handlers/base.py:96
└─0.126hello_worlddjango_example/views.py:4

最后的話

本文分享了 pyinstrument 的用法,有了這個性能分析神器,以后優(yōu)化代碼可以節(jié)省很多時間了,這樣的效率神器很值得分享,畢竟人生苦短,能多點時間干點有意思的不香么?

責(zé)任編輯:haq


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編程
    +關(guān)注

    關(guān)注

    90

    文章

    3716

    瀏覽量

    97204
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4968

    瀏覽量

    74012

原文標題:效率神器:快速定位運行最慢的代碼

文章出處:【微信號:LinuxHub,微信公眾號:Linux愛好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    2026年,如何快速找到適合你企業(yè)的AI+MES切入點?

    2026年,成功的制造企業(yè)不再是那些擁有最多機器人的企業(yè),而是那些能夠利用AI+MES系統(tǒng),讓數(shù)據(jù)在生產(chǎn)全流程中自動流動、自動決策、自動優(yōu)化的企業(yè)。對于管理者而言,現(xiàn)在的核心任務(wù)不是“要不要做”,而是“如何快速找到適合自身行業(yè)的AI+MES切入點”。
    的頭像 發(fā)表于 02-27 10:40 ?79次閱讀

    多品牌儲設(shè)備,如何快速接入儲云?

    2025年新型儲裝機破7000萬千瓦,電站運維成為新瓶頸。ZWS智慧儲云平臺以"建模即接入"理念,使儲設(shè)備能夠快速接入云端,實現(xiàn)云端數(shù)字化運維和管控。儲
    的頭像 發(fā)表于 02-06 11:43 ?426次閱讀
    多品牌儲<b class='flag-5'>能</b>設(shè)備,如何<b class='flag-5'>快速</b>接入儲<b class='flag-5'>能</b>云?

    從零開始安裝并配置開源AI編程神器OpenCode

    編程神器OpenCode吧! 一,第一步:環(huán)境準備 (Node.js & opencode 然后鍵入命令,“/connect",連接編程大模型供應(yīng)商。 選擇“Z.AI Coding Plan”,如下所示
    的頭像 發(fā)表于 01-22 21:22 ?1276次閱讀
    從零開始安裝并配置開源AI<b class='flag-5'>編程</b><b class='flag-5'>神器</b>OpenCode

    華芯微電子紅外智能開發(fā)軟件的核心亮點

    還在為紅外遙控器方案開發(fā)頭疼?不懂單片機編程、看不懂復(fù)雜代碼,卻想快速落地項目?今天給大家推薦一款“開發(fā)神器”—— 華芯微紅外智能開發(fā)軟件,讓普通紅外發(fā)射方案開發(fā)變得簡單高效,新手也
    的頭像 發(fā)表于 01-20 16:05 ?863次閱讀
    華芯微電子紅外智能開發(fā)軟件的核心亮點

    MCU代碼需要搬到RAM中才能運行嗎?不這樣做會有什么不妥嘛?

    部分單片機的代碼直接在nor flash中運行,少部分需要加載到ram中。 nor flash可以直接尋址一個字節(jié),可以找到一個指令的具體
    發(fā)表于 12-04 07:39

    在極海APM32系列MCU中如何把代碼重定位到SDRAM運行

    在有些情況下,我們想要把代碼放到SDRAM運行。下面介紹在APM32的MCU中,如何把代碼重定位到SDRAM運行。對于不同APM32系列的MCU,方法都是一樣的。
    的頭像 發(fā)表于 11-04 09:14 ?5196次閱讀
    在極海APM32系列MCU中如何把<b class='flag-5'>代碼</b>重定位到SDRAM<b class='flag-5'>運行</b>

    物聯(lián)網(wǎng)平臺應(yīng)用環(huán)境監(jiān)控:低代碼編程簡化開發(fā),組態(tài)應(yīng)用

    復(fù)雜開發(fā)轉(zhuǎn)化為“拖拽組件、關(guān)聯(lián)設(shè)備”的簡單操作,讓企業(yè)無需編程快速搭建、靈活調(diào)整監(jiān)控系統(tǒng),適配工業(yè)、園區(qū)、農(nóng)業(yè)等多場景環(huán)境監(jiān)控需求。 一、低代碼
    的頭像 發(fā)表于 08-29 15:33 ?920次閱讀

    TLE9893是否支持在FLASH1上運行代碼來擦除和編程FLASH1?

    芯片TLE9893是否支持在FLASH1上運行代碼來擦除和編程FLASH1。在NVM-PROG_UCODE中,代碼在FLASH1上運行,并將
    發(fā)表于 08-13 08:14

    代碼開發(fā)云平臺是什么?零編程零成本搭建

    代碼物聯(lián)網(wǎng)云平臺是種融合了低代碼開發(fā)能力與物聯(lián)網(wǎng)(IoT)技術(shù)的云端服務(wù)平臺,其核心目標是大幅降低物聯(lián)網(wǎng)應(yīng)用的開發(fā)門檻和成本,讓用戶無需專業(yè)編程經(jīng)驗,也
    的頭像 發(fā)表于 07-31 15:25 ?764次閱讀

    STM32IDE如何設(shè)定代碼到ITCM中運行?

    近期使用STM32MUX生成STM32IDE的代碼(MCU是STM32H743),目前希望可以將部分代碼定位到ITCM中運行,加快處理速度,關(guān)于代碼
    發(fā)表于 06-24 06:45

    零基礎(chǔ)學(xué)習(xí)LuatOS編程快速上手開發(fā)實戰(zhàn)教程!

    到實踐的跨越。 學(xué)習(xí)LuatOS的主要方法之一是“運行各個功能模塊的demo代碼”,本期特別分享——LuatOS編程起步相關(guān)內(nèi)容。 ? 注意:本文檔的讀者,默認都已經(jīng)了解初步的Lua語法。 ? 如果不懂Lua語法的話,可以參考下
    的頭像 發(fā)表于 06-13 17:27 ?627次閱讀
    零基礎(chǔ)學(xué)習(xí)LuatOS<b class='flag-5'>編程</b>:<b class='flag-5'>快速</b>上手開發(fā)實戰(zhàn)教程!

    同樣的代碼在官方開發(fā)板上運行正常,在自己板子上就跑不起來,怎么辦?

    UART交互,CLI代碼所在目錄為:SDK安裝目錄examplesperipheralcli。如果這2個程序運行正常,說明你的焊接問題
    的頭像 發(fā)表于 05-12 15:26 ?790次閱讀
    同樣的<b class='flag-5'>代碼</b>在官方開發(fā)板上<b class='flag-5'>運行</b>正常,在自己板子上就跑不起來,怎么辦?

    RAKsmart企業(yè)服務(wù)器上部署DeepSeek編寫運行代碼

    在RAKsmart企業(yè)服務(wù)器上部署并運行DeepSeek模型的代碼示例和詳細步驟。假設(shè)使用 Python + Transformers庫 + FastAPI實現(xiàn)一個基礎(chǔ)的AI服務(wù)。主機推薦小編為您整理發(fā)布RAKsmart企業(yè)服務(wù)器上部署DeepSeek編寫
    的頭像 發(fā)表于 03-25 10:39 ?709次閱讀

    使用 QWQ:32B 模型搭配 VSCode 的 Cline 插件實現(xiàn)自動化代碼編程

    作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 一,概述 隨著人工智能技術(shù)的快速發(fā)展,自動化編程工具逐漸成為開發(fā)者的得力助手。QWQ:32B 模型是一種先進的自然語言處理模型,能夠理解并生成高質(zhì)量的代碼
    的頭像 發(fā)表于 03-21 18:12 ?1330次閱讀
    使用 QWQ:32B 模型搭配 VSCode 的 Cline 插件實現(xiàn)自動化<b class='flag-5'>代碼</b><b class='flag-5'>編程</b>!

    在i.MX RT 1176上正常運行代碼時與使用IAR調(diào)試代碼時存在一些奇怪的差異,為什么?

    我在 i.MX RT 1176 上正常運行代碼時的行為與使用 IAR 調(diào)試代碼時的行為之間存在一些奇怪的差異,并注意到這是由于堆棧指針的初始化方式造成的。 我的重置向量表將其指向 DTC 的頂部
    發(fā)表于 03-17 07:26