91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

SCEV如何對(duì)變量進(jìn)行分析優(yōu)化

openEuler ? 來(lái)源:openEuler ? 作者:openEuler ? 2022-07-07 11:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

0. 基礎(chǔ)知識(shí)盤(pán)點(diǎn)

0.1 循環(huán)(loop)

定義
loop(llvm里理解為natural loop)是定義在CFG中的一個(gè)結(jié)點(diǎn)集合L,并具有以下屬性[1][2]:

有單一的入口結(jié)點(diǎn)(稱(chēng)為header),該結(jié)點(diǎn)支配loop中的所有結(jié)點(diǎn);

存在一條進(jìn)入循環(huán)頭的回邊;

相關(guān)術(shù)語(yǔ)

entering block:一個(gè)非loop內(nèi)的結(jié)點(diǎn)有一條邊連接到loop。當(dāng)只有一個(gè)entering block且其只有一條邊連接到header,稱(chēng)之為preheader;作為非loop結(jié)點(diǎn)的peheader支配整個(gè)loop;

latch:有一條邊連接到header;

backedge:稱(chēng)為回邊,一條從latch到header的邊;

exiting edge:一條邊從loop內(nèi)到loop外,邊的出發(fā)結(jié)點(diǎn)稱(chēng)之為exiting block,目標(biāo)結(jié)點(diǎn)稱(chēng)之為exit block;

10e78e90-fd25-11ec-ba43-dac502259ad0.jpg

上面右圖中,黃色區(qū)域是一個(gè)loop,而紅色區(qū)域不是,為什么呢?
因?yàn)榧t色區(qū)域a和c都是入口結(jié)點(diǎn),不滿(mǎn)足單一入口結(jié)點(diǎn)的性質(zhì)。

0.2 Scalar Evolution(SCEV)

定義

SCEV是編譯器對(duì)變量進(jìn)行分析的優(yōu)化(往往只針對(duì)整數(shù)類(lèi)型),且主要用于分析循環(huán)中變量是如何被更新的,然后根據(jù)這個(gè)信息來(lái)進(jìn)行優(yōu)化。

循環(huán)鏈

如圖所示,循環(huán)中歸納變量var的起始值為start,迭代的方式為?,步長(zhǎng)為step;

10f6beec-fd25-11ec-ba43-dac502259ad0.jpg

它的循環(huán)鏈(chrec,Chains of Recurrences)如下:

var = {start, ? , step}
// ?∈{+,?}
// start: starting value
// step: step in each iteration

舉個(gè)例子:

intm=0;
for(inti=0;i

那么m的循環(huán)鏈為:m = {0,+,n}。

1. Induction Variable(歸納變量)

1.1 定義

循環(huán)的每次迭代中增加或減少固定量的變量,或者是另一個(gè)歸納變量的線(xiàn)性函數(shù)。

舉個(gè)例子[3],下面循環(huán)中的i和j都是歸納變量:

for(i=0;i

1.2 益處

歸納變量?jī)?yōu)化的好處,有但不局限于以下幾點(diǎn):

用更簡(jiǎn)單的指令替換原來(lái)的計(jì)算方式。
比如,上面的例子中識(shí)別到歸納變量,將對(duì)應(yīng)的乘法替換為代價(jià)更小的加法。

j=-17;
for(i=0;i

減少歸納變量的數(shù)目,降低寄存器壓力。

externintsum;
intfoo(intn){
inti,j;
j=5;
for(i=0;i

當(dāng)前的loop有兩個(gè)歸納變量:i、j,用其中一個(gè)變量表達(dá)另外一個(gè)后,如下:

externintsum;
intfoo(intn){
inti;
for(i=0;i

歸納變量替換,使變量和循環(huán)索引之間的關(guān)系變得明確,便于其他優(yōu)化分析(如依賴(lài)性分析)。舉例如下,將c表示為循環(huán)索引相關(guān)的函數(shù):

intc,i;
c=10;
for(i=0;i

轉(zhuǎn)換為:

intc,i;
c=10;
for(i=0;i

2. 實(shí)踐

2.1 相關(guān)編譯選項(xiàng)

compiler option
gcc -fivopt
畢昇 -indvars

2.2 優(yōu)化用例

歸納變量的優(yōu)化(ivs)在llvm中的位置是:llvmlibTransformsScalarIndVarSimplify.cpp
讓我們通過(guò)一個(gè)用例,看看畢昇編譯器的優(yōu)化過(guò)程。
如下圖,假設(shè)上面func里面的部分就是要優(yōu)化的代碼,下面func里面就是預(yù)期生成的結(jié)果:

11136ae2-fd25-11ec-ba43-dac502259ad0.jpg

它的IR用例test.ll是:

11261e44-fd25-11ec-ba43-dac502259ad0.jpg

編譯命令是:

opt test.ll -indvars -S

當(dāng)前的例子中,header、latch和exiting block都是同一個(gè)BB,即bb5。

11418b5c-fd25-11ec-ba43-dac502259ad0.jpg

步驟一:依據(jù) def-use 關(guān)系,遍歷loop的 ExitBlock 中phi結(jié)點(diǎn)的操作數(shù)的來(lái)源,計(jì)算出最終值同時(shí)替換它,繼而替換該phi結(jié)點(diǎn)的使用。
例子中,計(jì)算 %tmp2.lcssa ,其唯一的操作數(shù)是 %tmp2 = add nuw nsw i32 %i.01.0, 3 ,該表達(dá)式所在的loop是bb5,此時(shí) %tmp2 的循環(huán)鏈為

%tmp2={3,+,3}<%bb5>

獲取當(dāng)前l(fā)oop的不退出循環(huán)的最大值是199999,那當(dāng)前 %tmp2=add(3, mul(3,199999))=600000;接下來(lái)會(huì)看當(dāng)前的替換不是高代價(jià)(代價(jià)的計(jì)算會(huì)依據(jù)不同架構(gòu)有所不同),同時(shí)在phi結(jié)點(diǎn)的 user 中替換該值。優(yōu)化結(jié)果如下:

1154e684-fd25-11ec-ba43-dac502259ad0.jpg

步驟二:遍歷 ExitingBlock ,對(duì)其跳轉(zhuǎn)條件進(jìn)行計(jì)算,依據(jù) def-use 的關(guān)系,刪除相應(yīng)的指令。
例子中,計(jì)算出 br i1 %0, label %bb5, label %bb7 的 %0 是 false,跳轉(zhuǎn)指令替換后,%0 = icmp ult i32 %tmp4,200000 不存在 user,將其加入到“死指令”中。優(yōu)化結(jié)果如下:

11690db2-fd25-11ec-ba43-dac502259ad0.jpg

步驟三:刪除所有“死指令”,并看看他的操作數(shù)是否要一并刪除。
例子中,作為 %0 的操作數(shù)的 %tmp4 還有其他的 user %x.03.0,因此不能被視為“死指令”被刪除。優(yōu)化結(jié)果如下:

118b3f04-fd25-11ec-ba43-dac502259ad0.jpg

步驟四:刪除 HeaderBlock 中的“死”phi結(jié)點(diǎn)。
例子中, %tmp4 和phi結(jié)點(diǎn) %x.03.0 構(gòu)成了一個(gè)不會(huì)有成果的循環(huán),就會(huì)刪除它們,同理刪除 %tmp2 和 %i.01.0 。優(yōu)化結(jié)果如下:

11c0930c-fd25-11ec-ba43-dac502259ad0.jpg

原文標(biāo)題:編譯器優(yōu)化那些事兒(4):歸納變量

文章出處:【微信公眾號(hào):openEuler】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 寄存器
    +關(guān)注

    關(guān)注

    31

    文章

    5609

    瀏覽量

    130032
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1672

    瀏覽量

    51675
  • CFG
    CFG
    +關(guān)注

    關(guān)注

    0

    文章

    10

    瀏覽量

    10139

原文標(biāo)題:編譯器優(yōu)化那些事兒(4):歸納變量

文章出處:【微信號(hào):openEulercommunity,微信公眾號(hào):openEuler】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    API數(shù)據(jù)分析:淘寶流量來(lái)源分析,渠道優(yōu)化

    ? 在電商領(lǐng)域,流量來(lái)源分析優(yōu)化營(yíng)銷(xiāo)策略的核心。淘寶作為中國(guó)領(lǐng)先的電商平臺(tái),其流量數(shù)據(jù)可通過(guò)API(應(yīng)用程序接口)高效獲取和分析。本技術(shù)帖將逐步指導(dǎo)您如何利用淘寶API進(jìn)行流量來(lái)源
    的頭像 發(fā)表于 01-23 13:42 ?207次閱讀
    API數(shù)據(jù)<b class='flag-5'>分析</b>:淘寶流量來(lái)源<b class='flag-5'>分析</b>,渠道<b class='flag-5'>優(yōu)化</b>!

    【產(chǎn)品介紹】Altair OptiStruct結(jié)構(gòu)分析優(yōu)化軟件

    AltairOptiStruct支持結(jié)構(gòu)分析優(yōu)化OptiStruct是一款久經(jīng)考驗(yàn)且成熟的現(xiàn)代化結(jié)構(gòu)求解器,它可為線(xiàn)性和非線(xiàn)性分析提供綜合、準(zhǔn)確且可擴(kuò)展的解決方案,適用于多個(gè)學(xué)科,包括靜力學(xué)和動(dòng)力學(xué)
    的頭像 發(fā)表于 01-06 17:56 ?1455次閱讀
    【產(chǎn)品介紹】Altair OptiStruct結(jié)構(gòu)<b class='flag-5'>分析</b><b class='flag-5'>優(yōu)化</b>軟件

    請(qǐng)問(wèn)Keil的優(yōu)化等級(jí)到底該如何選擇?

    做任何優(yōu)化。代碼的執(zhí)行順序與源代碼完全一致,變量始終存儲(chǔ)在內(nèi)存中(不進(jìn)行寄存器優(yōu)化),函數(shù)調(diào)用棧幀清晰。 -O1 (有限優(yōu)化 / Opti
    發(fā)表于 11-20 07:51

    Coremark測(cè)試集分析與性能優(yōu)化思路

    需要執(zhí)行switch和if語(yǔ)句。因此,這部分代碼使用一個(gè)小型摩爾狀態(tài)機(jī),它將字符串輸入標(biāo)識(shí)為數(shù)字,并根據(jù)格式對(duì)其進(jìn)行劃分。 狀態(tài)機(jī)將解析輸入字符串,直到遇到“,”分隔符或輸入結(jié)束。無(wú)效數(shù)字將導(dǎo)致?tīng)顟B(tài)機(jī)
    發(fā)表于 10-24 08:21

    如何對(duì)蜂鳥(niǎo)e203內(nèi)核乘除法器進(jìn)行優(yōu)化

    器:對(duì)每個(gè)流水線(xiàn)階段中的數(shù)據(jù)進(jìn)行部分商和余數(shù)的計(jì)算和累加操作。 二、優(yōu)化方案 優(yōu)化乘法器 為了提高蜂鳥(niǎo)E203的乘法器性能,可以采取以下幾個(gè)優(yōu)化方案: 采用更高效的算法:Booth算
    發(fā)表于 10-24 06:47

    改進(jìn)wallance樹(shù)乘法器優(yōu)化方法

    首先,根據(jù)之前分享的乘法器的優(yōu)缺點(diǎn),我們針對(duì)17周期的乘法器進(jìn)行優(yōu)化,為乘法設(shè)計(jì)的專(zhuān)用數(shù)據(jù)通路,為了保持e203的低功耗、低面積的優(yōu)點(diǎn)、我們?nèi)圆捎没?booth算法進(jìn)行部分積生成,而對(duì)于原有的17
    發(fā)表于 10-23 06:37

    影響同步帶模組成本的五大核心變量分析

    影響同步帶模組成本的五大核心變量
    的頭像 發(fā)表于 10-15 17:52 ?608次閱讀
    影響同步帶模組成本的五大核心<b class='flag-5'>變量分析</b>

    PLC中Static和Temp變量的區(qū)別

    大家好,收到粉絲投稿,讓博主講下Static變量和Temp變量的區(qū)別,新入行的兄弟可能會(huì)對(duì)這兩個(gè)概念不太能理解。
    的頭像 發(fā)表于 09-24 14:51 ?1422次閱讀
    PLC中Static和Temp<b class='flag-5'>變量</b>的區(qū)別

    推進(jìn)電機(jī)端蓋結(jié)構(gòu)的抗沖擊分析優(yōu)化

    。同時(shí)以此為基礎(chǔ),在保證推進(jìn)電機(jī)的抗沖擊性能的約束前提條件下,以提高電機(jī)的轉(zhuǎn)矩密度為目標(biāo),建立了相應(yīng)的數(shù)學(xué)模型和參數(shù)化的有限元模型,對(duì)該結(jié)構(gòu)進(jìn)行了設(shè)計(jì)優(yōu)化,為實(shí)際工程設(shè)計(jì)了奠定基礎(chǔ)。 純分享帖,需要者可點(diǎn)
    發(fā)表于 06-23 07:12

    VirtualLab:光柵的優(yōu)化分析

    光柵是光學(xué)工程師使用的最基本的工具。為了設(shè)計(jì)和分析這類(lèi)組件,快速物理光學(xué)建模和設(shè)計(jì)軟件VirtualLab Fusion為用戶(hù)提供了許多有用的工具。其中包括參數(shù)優(yōu)化,以輕松優(yōu)化系統(tǒng),以及參數(shù)運(yùn)行,它
    發(fā)表于 05-23 08:49

    VirtualLab 應(yīng)用:傾斜光柵的參數(shù)優(yōu)化及公差分析

    允許為目標(biāo)值定義參數(shù)約束和權(quán)重值。更多信息請(qǐng)參見(jiàn): 參數(shù)優(yōu)化文檔的介紹 第一級(jí)次的參數(shù)優(yōu)化 **結(jié)果——公差分析 **
    發(fā)表于 05-22 08:52

    RAKsmart服務(wù)器SEO優(yōu)化優(yōu)勢(shì)分析

    在RAKsmart服務(wù)器上搭建SEO網(wǎng)站,可以借助其基礎(chǔ)設(shè)施和服務(wù)特性,從技術(shù)層面優(yōu)化搜索引擎排名。以下是具體優(yōu)勢(shì)及分析,主機(jī)推薦小編為您整理發(fā)布RAKsmart服務(wù)器SEO優(yōu)化優(yōu)勢(shì)分析
    的頭像 發(fā)表于 04-22 10:12 ?677次閱讀

    Ansible Playbook中的變量使用技巧

    在inventory中定義的連接變量(比如ansible_ssh_user);優(yōu)先級(jí)第二。
    的頭像 發(fā)表于 04-15 10:26 ?995次閱讀

    OptiSystem應(yīng)用:增益平坦濾波器優(yōu)化

    10次,目標(biāo)是在1500至1600 nm范圍內(nèi)產(chǎn)生0.1 dB的增益紋波。濾波器的最小傳輸值為-40 dB,最大值為-0.1 dB。濾波器的傳輸值將在濾波器中定義的用戶(hù)定義頻率下進(jìn)行優(yōu)化。組件選項(xiàng)卡應(yīng)選
    發(fā)表于 04-10 08:49

    VirtualLab Fusion應(yīng)用:使用optiSLang進(jìn)行光柵優(yōu)化

    1.摘要 當(dāng)代光學(xué)系統(tǒng)的優(yōu)化往往涉及大量參數(shù)。正如光柵的優(yōu)化設(shè)計(jì),不僅需要考慮光柵的幾何參數(shù),更需要分析所需的入射方向。這樣的需求導(dǎo)致優(yōu)化過(guò)程面臨大量參數(shù)的挑戰(zhàn)。在本實(shí)例中,Virtu
    發(fā)表于 03-18 08:51