91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

python多線程和多進(jìn)程的對(duì)比

python爬蟲知識(shí)分享 ? 來源:python爬蟲知識(shí)分享 ? 作者:python爬蟲知識(shí)分享 ? 2022-03-15 16:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. 基本概念

在開始講解理論知識(shí)之前,先過一下幾個(gè)基本概念。雖然咱是進(jìn)階教程,但我也希望寫得更小白,更通俗易懂。

串行:一個(gè)人在同一時(shí)間段只能干一件事,譬如吃完飯才能看電視;

并行:一個(gè)人在同一時(shí)間段可以干多件事,譬如可以邊吃飯邊看電視;

Python中,多線程協(xié)程 雖然是嚴(yán)格上來說是串行,但卻比一般的串行程序執(zhí)行效率高得很。 一般的串行程序,在程序阻塞的時(shí)候,只能干等著,不能去做其他事。就好像,電視上播完正劇,進(jìn)入廣告時(shí)間,我們卻不能去趁廣告時(shí)間是吃個(gè)飯。對(duì)于程序來說,這樣做顯然是效率極低的,是不合理的。

雖然 多線程協(xié)程 已經(jīng)相當(dāng)智能了。但還是不夠高效,最高效的應(yīng)該是一心多用,邊看電視邊吃飯邊聊天。這就是我們的 多進(jìn)程 才能做的事了。

2. 單線程VS多線程VS多進(jìn)程

文字總是蒼白無力的,不如用代碼直接來測(cè)試一下。

開始對(duì)比之前,首先定義四種類型的場(chǎng)景

- CPU計(jì)算密集型

- 磁盤IO密集型

- 網(wǎng)絡(luò)IO密集型

- 【模擬】IO密集型

為什么是這幾種場(chǎng)景,這和多線程 多進(jìn)程的適用場(chǎng)景有關(guān)。結(jié)論里,我再說明。

# CPU計(jì)算密集型
def count(x=1, y=1):
    # 使程序完成150萬計(jì)算
    c = 0
    while c < 500000:
        c += 1
        x += x
        y += y


# 磁盤讀寫IO密集型
def io_disk():
    with open("file.txt", "w") as f:
        for x in range(5000000):
            f.write("python-learning\n")


# 網(wǎng)絡(luò)IO密集型
header = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'}
url = "https://www.tieba.com/"

def io_request():
    try:
        webPage = requests.get(url, headers=header)
        html = webPage.text
        return
    except Exception as e:
        return {"error": e}


# 【模擬】IO密集型
def io_simulation():
    time.sleep(2)

比拼的指標(biāo),我們用時(shí)間來考量。時(shí)間耗費(fèi)得越少,說明效率越高。

為了方便,使得代碼看起來,更加簡(jiǎn)潔,我這里先定義是一個(gè)簡(jiǎn)單的 時(shí)間計(jì)時(shí)器 的裝飾器。 如果你對(duì)裝飾器還不是很了解,也沒關(guān)系,你只要知道它是用于 計(jì)算函數(shù)運(yùn)行時(shí)間的東西就可以了。

def timer(mode):
    def wrapper(func):
        def deco(*args, **kw):
            type = kw.setdefault('type', None)
            t1=time.time()
            func(*args, **kw)
            t2=time.time()
            cost_time = t2-t1
            print("{}-{}花費(fèi)時(shí)間:{}秒".format(mode, type,cost_time))
        return deco
    return wrapper

第一步,先來看看單線程的
@timer("【單線程】")
def single_thread(func, type=""):
    for i in range(10):
              func()

# 單線程
single_thread(count, type="CPU計(jì)算密集型")
single_thread(io_disk, type="磁盤IO密集型")
single_thread(io_request,type="網(wǎng)絡(luò)IO密集型")
single_thread(io_simulation,type="模擬IO密集型")

看看結(jié)果

【單線程】-CPU計(jì)算密集型花費(fèi)時(shí)間:83.42633867263794秒
【單線程】-磁盤IO密集型花費(fèi)時(shí)間:15.641993284225464秒
【單線程】-網(wǎng)絡(luò)IO密集型花費(fèi)時(shí)間:1.1397218704223633秒
【單線程】-模擬IO密集型花費(fèi)時(shí)間:20.020972728729248秒

第二步,再來看看多線程的

@timer("【多線程】")
def multi_thread(func, type=""):
    thread_list = []
    for i in range(10):
        t=Thread(target=func, args=())
        thread_list.append(t)
        t.start()
    e = len(thread_list)

    while True:
        for th in thread_list:
            if not th.is_alive():
                e -= 1
        if e <= 0:
            break

# 多線程
multi_thread(count, type="CPU計(jì)算密集型")
multi_thread(io_disk, type="磁盤IO密集型")
multi_thread(io_request, type="網(wǎng)絡(luò)IO密集型")
multi_thread(io_simulation, type="模擬IO密集型")

看看結(jié)果

【多線程】-CPU計(jì)算密集型花費(fèi)時(shí)間:93.82986998558044秒
【多線程】-磁盤IO密集型花費(fèi)時(shí)間:13.270896911621094秒
【多線程】-網(wǎng)絡(luò)IO密集型花費(fèi)時(shí)間:0.1828296184539795秒
【多線程】-模擬IO密集型花費(fèi)時(shí)間:2.0288875102996826秒

第三步,最后來看看多進(jìn)程

@timer("【多進(jìn)程】")
def multi_process(func, type=""):
    process_list = []
    for x in range(10):
        p = Process(target=func, args=())
        process_list.append(p)
        p.start()
    e = process_list.__len__()

    while True:
        for pr in process_list:
            if not pr.is_alive():
                e -= 1
        if e <= 0:
            break

# 多進(jìn)程
multi_process(count, type="CPU計(jì)算密集型")
multi_process(io_disk, type="磁盤IO密集型")
multi_process(io_request, type="網(wǎng)絡(luò)IO密集型")
multi_process(io_simulation, type="模擬IO密集型")

看看結(jié)果

【多進(jìn)程】-CPU計(jì)算密集型花費(fèi)時(shí)間:9.082211017608643秒
【多進(jìn)程】-磁盤IO密集型花費(fèi)時(shí)間:1.287339448928833秒
【多進(jìn)程】-網(wǎng)絡(luò)IO密集型花費(fèi)時(shí)間:0.13074755668640137秒
【多進(jìn)程】-模擬IO密集型花費(fèi)時(shí)間:2.0076842308044434秒

3. 性能對(duì)比成果總結(jié)

將結(jié)果匯總一下,制成表格。

https://file.elecfans.com//web2/M00/36/11/poYBAGIwUWCALmJbAADPTR8eNVs753.png

我們來分析下這個(gè)表格。

首先是CPU密集型,多線程以對(duì)比單線程,不僅沒有優(yōu)勢(shì),顯然還由于要不斷的加鎖釋放GIL全局鎖,切換線程而耗費(fèi)大量時(shí)間,效率低下,而多進(jìn)程,由于是多個(gè)CPU同時(shí)進(jìn)行計(jì)算工作,相當(dāng)于十個(gè)人做一個(gè)人的作業(yè),顯然效率是成倍增長(zhǎng)的。

然后是IO密集型,IO密集型可以是磁盤IO網(wǎng)絡(luò)IO,數(shù)據(jù)庫IO等,都屬于同一類,計(jì)算量很小,主要是IO等待時(shí)間的浪費(fèi)。通過觀察,可以發(fā)現(xiàn),我們磁盤IO,網(wǎng)絡(luò)IO的數(shù)據(jù),多線程對(duì)比單線程也沒體現(xiàn)出很大的優(yōu)勢(shì)來。這是由于我們程序的的IO任務(wù)不夠繁重,所以優(yōu)勢(shì)不夠明顯。

所以我還加了一個(gè)「模擬IO密集型」,用sleep來模擬IO等待時(shí)間,就是為了體現(xiàn)出多線程的優(yōu)勢(shì),也能讓大家更加直觀的理解多線程的工作過程。單線程需要每個(gè)線程都要sleep(2),10個(gè)線程就是20s,而多線程,在sleep(2)的時(shí)候,會(huì)切換到其他線程,使得10個(gè)線程同時(shí)sleep(2),最終10個(gè)線程也就只有2s.

可以得出以下幾點(diǎn)結(jié)論

單線程總是最慢的,多進(jìn)程總是最快的。

多線程適合在IO密集場(chǎng)景下使用,譬如爬蟲,網(wǎng)站開發(fā)等

多進(jìn)程適合在對(duì)CPU計(jì)算運(yùn)算要求較高的場(chǎng)景下使用,譬如大數(shù)據(jù)分析,機(jī)器學(xué)習(xí)

多進(jìn)程雖然總是最快的,但是不一定是最優(yōu)的選擇,因?yàn)樗枰狢PU資源支持下才能體現(xiàn)優(yōu)勢(shì)

審核編輯:符乾江

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 多線程
    +關(guān)注

    關(guān)注

    0

    文章

    279

    瀏覽量

    21033
  • python
    +關(guān)注

    關(guān)注

    57

    文章

    4876

    瀏覽量

    90058
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【瑞薩RA × Zephyr評(píng)測(cè)】多線程和看門狗

    本文章旨在評(píng)估使用 Zephyr RTOS 在 Renesas FPB-RA6E2 開發(fā)板上實(shí)現(xiàn)多線程調(diào)度與硬件看門狗功能的應(yīng)用。評(píng)估內(nèi)容包括任務(wù)調(diào)度、看門狗初始化流程、主程序邏輯的詳細(xì)解析,以及實(shí)驗(yàn)現(xiàn)象與數(shù)據(jù)分析。
    的頭像 發(fā)表于 01-10 10:23 ?2476次閱讀
    【瑞薩RA × Zephyr評(píng)測(cè)】<b class='flag-5'>多線程</b>和看門狗

    解析Linux的進(jìn)程、線程和協(xié)程

    和系統(tǒng)資源。線程的引入使得多核處理器得以充分利用,因?yàn)?b class='flag-5'>多線程程序可以更有效地分配和管理多核心的計(jì)算資源。 線程的特點(diǎn)包括: (1)共享性:線程之間共享同一
    發(fā)表于 12-22 11:00

    多線程的系統(tǒng)

    多線程系統(tǒng)的事件響應(yīng)也是在中斷中完成的,但事件的處理是在線程中完成的。在多線程系統(tǒng)中,線程跟中斷一樣,也具有優(yōu)先級(jí),優(yōu)先級(jí)高的線程會(huì)被優(yōu)先執(zhí)
    發(fā)表于 12-08 07:55

    嵌入式應(yīng)掌握的幾種能力

    RT-Thread等。學(xué)習(xí)操作系統(tǒng)內(nèi)核知識(shí):線程調(diào)度、時(shí)鐘管理、線程間同步、線程間通信、內(nèi)存管理、設(shè)備管理等,并掌握基本的使用。 再熟悉Linux操作系統(tǒng)的基本使用。 再學(xué)習(xí)Linux下的應(yīng)用開發(fā)知識(shí):
    發(fā)表于 12-08 06:05

    Linux多線程對(duì)比線程的優(yōu)勢(shì)

    :「資源利用率」:通過多線程,可以更有效地利用CPU資源,特別是多核CPU?!覆⑿刑幚怼梗?b class='flag-5'>線程允許同時(shí)執(zhí)行多個(gè)任務(wù),提高程序的執(zhí)行效率?!负?jiǎn)化設(shè)計(jì)」:使用線程可以簡(jiǎn)化程序設(shè)計(jì),因?yàn)?b class='flag-5'>線程
    發(fā)表于 12-01 06:11

    飛凌嵌入式ElfBoard-文件I/O的了解探究之競(jìng)爭(zhēng)冒險(xiǎn)

    競(jìng)爭(zhēng)冒險(xiǎn)(Race Condition)指的是在多線程多進(jìn)程環(huán)境中,多個(gè)線程進(jìn)程對(duì)共享資源進(jìn)行訪問和修改時(shí)可能導(dǎo)致的不確定性結(jié)果或錯(cuò)誤行為。競(jìng)爭(zhēng)冒險(xiǎn)通常發(fā)生在多個(gè)
    發(fā)表于 11-26 15:38

    rt-thread studio 如何進(jìn)行多線程編譯?

    ,使用的是5800h+32g內(nèi)存+sn550 ssd,開啟16線程編譯時(shí)cpu的占用率也只能到30%,編譯完整個(gè)工程需要3分鐘 感覺多線程編譯設(shè)置沒有生效,有辦法提高編譯速度嗎 rtthread studio版本是 2.2.9
    發(fā)表于 10-11 09:16

    多線程與多處理有何區(qū)別

    多處理也稱為進(jìn)程進(jìn)程是一個(gè)在自己的內(nèi)存空間中運(yùn)行的獨(dú)立程序。
    的頭像 發(fā)表于 09-16 14:21 ?561次閱讀

    【HZ-T536開發(fā)板免費(fèi)體驗(yàn)】—— linux創(chuàng)建線程

    線程進(jìn)程 一個(gè)進(jìn)程指的是一個(gè)正在執(zhí)行的應(yīng)用程序,而線程的功能是執(zhí)行應(yīng)用程序中的某個(gè)具體任務(wù)。線程具有傳統(tǒng)
    發(fā)表于 09-01 21:31

    多線程的安全注意事項(xiàng)

    多線程安全是指多個(gè)線程同時(shí)訪問或修改共享資源時(shí),能夠保證程序的正確性和可靠性。 開發(fā)者選擇TaskPool或Worker進(jìn)行多線程開發(fā)時(shí),在TaskPool和Worker的工作線程中導(dǎo)
    發(fā)表于 06-20 07:49

    TaskPool和Worker的對(duì)比分析

    支持。不支持。適用場(chǎng)景對(duì)比 TaskPool和Worker均支持多線程并發(fā)能力。由于TaskPool的工作線程會(huì)綁定系統(tǒng)的調(diào)度優(yōu)先級(jí),并且支持負(fù)載均衡(自動(dòng)擴(kuò)縮容),而Worker需要開發(fā)者自行創(chuàng)建
    發(fā)表于 06-18 06:43

    工控一體機(jī)多線程任務(wù)調(diào)度優(yōu)化:聚徽分享破解工業(yè)復(fù)雜流程高效協(xié)同密碼

    在當(dāng)今工業(yè) 4.0 的浪潮下,工業(yè)生產(chǎn)正朝著高度自動(dòng)化、智能化的方向大步邁進(jìn)。生產(chǎn)流程日益復(fù)雜,眾多任務(wù)需要同時(shí)、高效地協(xié)同執(zhí)行,這對(duì)工業(yè)控制系統(tǒng)的核心 —— 工控一體機(jī)提出了前所未有的挑戰(zhàn)。多線程
    的頭像 發(fā)表于 05-28 14:06 ?639次閱讀

    一種實(shí)時(shí)多線程VSLAM框架vS-Graphs介紹

    針對(duì)現(xiàn)有VSLAM系統(tǒng)語義表達(dá)不足、地圖可解釋性差的問題,本文提出vS-Graphs,一種實(shí)時(shí)多線程VSLAM框架。該方案顯著提升了重建地圖的語義豐富度、可解釋性及定位精度。實(shí)驗(yàn)表明
    的頭像 發(fā)表于 04-19 14:07 ?1009次閱讀
    一種實(shí)時(shí)<b class='flag-5'>多線程</b>VSLAM框架vS-Graphs介紹

    進(jìn)程、線程、協(xié)程傻傻分不清?一文帶你徹底扒光它們的\"底褲\"!

    外賣員(線程C):負(fù)責(zé)送外賣他們共用: 原料冰箱(共享內(nèi)存) 工作臺(tái)(棧空間)但不共享: 自己的工牌(線程ID) 心情日記(線程本地存儲(chǔ)) 代碼示例(Python
    發(fā)表于 03-26 09:27

    請(qǐng)問如何在Python中實(shí)現(xiàn)多線程多進(jìn)程的協(xié)作?

    大家好!我最近在開發(fā)一個(gè)Python項(xiàng)目時(shí),需要同時(shí)處理多個(gè)任務(wù),且每個(gè)任務(wù)需要不同的計(jì)算資源。我想通過多線程多進(jìn)程的組合來實(shí)現(xiàn)并發(fā),但遇到了一些問題。 具體來說,我有兩個(gè)任務(wù),一個(gè)是I/O密集型
    發(fā)表于 03-11 06:57