91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從內(nèi)存分配的角度來(lái)分析下string的實(shí)現(xiàn)機(jī)制

工程師鄧生 ? 來(lái)源:高性能架構(gòu)探索 ? 作者:雨樂(lè) ? 2022-09-05 08:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大家好!對(duì)于C++開(kāi)發(fā)人員來(lái)說(shuō),string大概是使用最多的標(biāo)準(zhǔn)庫(kù)數(shù)據(jù)結(jié)構(gòu)之一,一直以來(lái)也就僅限于使用,對(duì)于底層實(shí)現(xiàn)似懂非懂。所以,最近抽出點(diǎn)時(shí)間,大致研究了下string的底層實(shí)現(xiàn)。今天,就從內(nèi)存分配的角度來(lái)分析下string的實(shí)現(xiàn)機(jī)制。

直接分配

大概在08年的時(shí)候,手動(dòng)實(shí)現(xiàn)過(guò)string,沒(méi)有考慮性能,所以單純是從功能的角度進(jìn)行實(shí)現(xiàn),下面摘抄了部分代碼,如下:

string::string(constchar*s){
size_=strlen(s);
buffer_=newchar[size_+1];
strcpy(buffer_,s);
}

string&string::string(conststring&str){
size_+=str.size_;
char*data=newchar[size_+1];
strcpy(data,buffer_);
strcat(data,str.buffer_);

delete[]buffer_;
buffer_=data;
return*this;
}

上述代碼為string的部分成員函數(shù),從上述實(shí)現(xiàn)可以看出,無(wú)論是構(gòu)造還是拷貝,都是重新在堆上(使用new關(guān)鍵字)分配一塊內(nèi)存。這樣做的優(yōu)點(diǎn)是實(shí)現(xiàn)簡(jiǎn)單,而缺點(diǎn)呢,因?yàn)槊看味荚诙焉线M(jìn)行分配,而堆上內(nèi)存的分配效率非常差(當(dāng)然是相對(duì)棧來(lái)說(shuō)的),所以有沒(méi)有更好的實(shí)現(xiàn)方式呢?下面我們看先STL中的基本實(shí)現(xiàn)。

SSO

記得之前在看Redis源碼的時(shí)候,對(duì)整數(shù)集合(intset)有個(gè)優(yōu)化:根據(jù)新元素的類型,擴(kuò)展整數(shù)集合底層數(shù)組的空間大小,并未新元素分配空間,也就是說(shuō),假設(shè)在初始的時(shí)候,集合中最大的數(shù)為3,那么這個(gè)時(shí)候集合的類型為INT_16,如果此時(shí)新增一個(gè)元素為65536,那么就將集合的類型更改為INT_32,并重新為集合分配空間,將之前的數(shù)據(jù)進(jìn)行類型擴(kuò)展。

那么string有沒(méi)有類似Redis整數(shù)集合的功能,進(jìn)行類型升級(jí)呢?

帶著這個(gè)疑問(wèn),研究了string源碼,發(fā)現(xiàn)里面使用了一個(gè)名為SSO的優(yōu)化策略~~~

SSO為Small String Optimization的簡(jiǎn)寫(xiě),中文譯為小字符串優(yōu)化,基本原理是:當(dāng)分配大小小于16個(gè)字節(jié)時(shí)候,從棧上進(jìn)行分配,而如果大于等于16個(gè)字節(jié),則在堆上進(jìn)行內(nèi)存分配。PS:需要注意的是,此優(yōu)化自GCC5.1生效,也就是說(shuō)對(duì)于GCC版本小于5的,無(wú)論長(zhǎng)度為多少,都從堆上進(jìn)行分配。

為了證實(shí)上述結(jié)論,測(cè)試代碼如下:

#include
#include
#include

void*operatornew(std::size_tn){
std::cout<

在上述代碼中,我們重載了operator new,以替換string中的new實(shí)現(xiàn),這樣做的好處是,可以通過(guò)輸出來(lái)發(fā)現(xiàn)是否調(diào)用了new進(jìn)行動(dòng)態(tài)分配。

G++ 4.9.4版本輸出如下:

0:
[Allocating26bytes]1:=
[Allocating27bytes]2:==
[Allocating28bytes]3:===
[Allocating29bytes]4:====
[Allocating30bytes]5:=====
[Allocating31bytes]6:======
[Allocating32bytes]7:=======
[Allocating33bytes]8:========
[Allocating34bytes]9:=========
[Allocating35bytes]10:==========
[Allocating36bytes]11:===========
[Allocating37bytes]12:============
[Allocating38bytes]13:=============
[Allocating39bytes]14:==============
[Allocating40bytes]15:===============
[Allocating41bytes]16:================
[Allocating42bytes]17:=================
[Allocating43bytes]18:==================
[Allocating44bytes]19:===================
[Allocating45bytes]20:====================
[Allocating46bytes]21:=====================
[Allocating47bytes]22:======================
[Allocating48bytes]23:=======================

GCC5.1 輸出如下:

0:
1:=
2:==
3:===
4:====
5:=====
6:======
7:=======
8:========
9:=========
10:==========
11:===========
12:============
13:=============
14:==============
15:===============
16:[Allocating17bytes]================
17:[Allocating18bytes]=================
18:[Allocating19bytes]==================
19:[Allocating20bytes]===================
20:[Allocating21bytes]====================
21:[Allocating22bytes]=====================
22:[Allocating23bytes]======================
23:[Allocating24bytes]=======================

從GCC5.1的輸出內(nèi)容可以看出,當(dāng)字符串長(zhǎng)度小于16的時(shí)候,沒(méi)有調(diào)用我們的operator new函數(shù),這就從側(cè)面證明了前面的結(jié)論當(dāng)分配大小小于16個(gè)字節(jié)時(shí)候,從棧上進(jìn)行分配,而如果大于等于16個(gè)字節(jié),則在堆上進(jìn)行內(nèi)存分配。(PS:GCC4.9.4版本的輸出,分配字節(jié)數(shù)大于實(shí)際的字節(jié)數(shù),這個(gè)是string的又一個(gè)優(yōu)化策略,即預(yù)分配策略,在后面的內(nèi)容中將會(huì)講到)。

直奔主題

不妨閉上眼睛,仔細(xì)想下,如果讓我們自己來(lái)實(shí)現(xiàn)該功能,你會(huì)怎么做?

可能大部分人的思路是:定義一個(gè)固定長(zhǎng)度的char數(shù)組,在進(jìn)行構(gòu)造的時(shí)候,判斷字符串的長(zhǎng)度,如果長(zhǎng)度小于某個(gè)定值,則使用該數(shù)組,否則在堆上進(jìn)行分配~~~

好了,為了驗(yàn)證上述思路與具體實(shí)現(xiàn)是否一致,結(jié)合源碼一起來(lái)分析~~

首先,摘抄了部分string的源碼,如下:string源碼

template
classbasic_string
{
private:
//Useempty-baseoptimization:http://www.cantrip.org/emptyopt.html
struct_Alloc_hider:allocator_type//TODOcheck__is_final
{
_Alloc_hider(pointer__dat,const_Alloc&__a=_Alloc())
:allocator_type(__a),_M_p(__dat){}

pointer_M_p;//Theactualdata.
};

_Alloc_hider_M_dataplus;
size_type_M_string_length;

enum{_S_local_capacity=15/sizeof(_CharT)};

union
{
_CharT_M_local_buf[_S_local_capacity+1];
size_type_M_allocated_capacity;
};
};

上面抽出了我們需要關(guān)注的部分代碼,只需要關(guān)注以下幾個(gè)點(diǎn):

?_M_string_length已分配字節(jié)數(shù)

?_M_dataplus實(shí)際數(shù)據(jù)存放的位置

? union字段:兩個(gè)字段中較大的一個(gè)_M_local_buf為 16 字節(jié)

?_M_local_buf這是一個(gè)用以實(shí)現(xiàn)SSO功能的字段,大小為16(15 + 1其中1為結(jié)束符)個(gè)字節(jié)

?_M_allocated_capacity是一種size_t類型,功能類似于vector中的預(yù)分配,其與_M_local_buf不能共存

從上述源碼中,我們看到有個(gè)變量_M_local_buf,從字面意思看就是一個(gè)本地或者局部buffer,猜測(cè)是用來(lái)存儲(chǔ)大小不足16字節(jié)的內(nèi)容,為了證實(shí)我們的猜測(cè),下面結(jié)合GDB一起再分析下SSO的實(shí)現(xiàn)機(jī)制,示例代碼如下:

#include

intmain(){
std::stringstr("hello");
return0;
}

gdb調(diào)試代碼如下:

(gdb)s
Singlesteppinguntilexitfromfunctionmain,
whichhasnolinenumberinformation.
std::basic_string,std::allocator>::basic_string(charconst*,std::allocatorconst&)()
at/root/gcc-5.4.0/build/x86_64-unknown-linux-gnu/libstdc++-v3/include/bits/basic_string.h:454
454basic_string(const_CharT*__s,const_Alloc&__a=_Alloc())
(gdb)s
141returnstd::pointer_traits::pointer_to(*_M_local_buf);
(gdb)n
454basic_string(const_CharT*__s,const_Alloc&__a=_Alloc())
(gdb)
456{_M_construct(__s,__s?__s+traits_type::length(__s):__s+npos);}
(gdb)
141returnstd::pointer_traits::pointer_to(*_M_local_buf);
(gdb)
456{_M_construct(__s,__s?__s+traits_type::length(__s):__s+npos);}
(gdb)
267{return__builtin_strlen(__s);}
(gdb)
456{_M_construct(__s,__s?__s+traits_type::length(__s):__s+npos);}
(gdb)
195_M_construct(__beg,__end,_Tag());
(gdb)
456{_M_construct(__s,__s?__s+traits_type::length(__s):__s+npos);}

單從上述信息不能很明確的了解整個(gè)構(gòu)造過(guò)程,我們留意到構(gòu)造的過(guò)程在basic_string.h:454,所以就通過(guò)源碼進(jìn)行分析,如下:

basic_string(const_CharT*__s,const_Alloc&__a=_Alloc())
:_M_dataplus(_M_local_data(),__a)
{_M_construct(__s,__s?__s+traits_type::length(__s):__s+npos);}

_M_construct從函數(shù)字面看出是用來(lái)構(gòu)造該對(duì)象,在后面進(jìn)行分析,下面先分析下M_dataplus函數(shù)實(shí)現(xiàn),

_M_local_data()const
{
#if__cplusplus>=201103L
returnstd::pointer_traits::pointer_to(*_M_local_buf);
#else
returnconst_pointer(_M_local_buf);
#endif
}

在前面內(nèi)容中,提到過(guò)_M_dataplus用來(lái)指向?qū)嶋H存儲(chǔ)數(shù)據(jù)的地址,在basic_string()函數(shù)的構(gòu)造中,首先將__M_dataplus指向local_buf,然后調(diào)用__M_construct進(jìn)行實(shí)際構(gòu)造,而M_construct最終會(huì)調(diào)用如下代碼:

template
template
void
basic_string<_CharT,?_Traits,?_Alloc>::
_M_construct(_InIterator__beg,_InIterator__end,
std::forward_iterator_tag)
{
//NB:Notrequired,butconsideredbestpractice.
if(__gnu_cxx::__is_null_pointer(__beg)&&__beg!=__end)
std::__throw_logic_error(__N("basic_string::"
"_M_constructnullnotvalid"));

size_type__dnew=static_cast(std::distance(__beg,__end));

if(__dnew>size_type(_S_local_capacity))
{
_M_data(_M_create(__dnew,size_type(0)));
_M_capacity(__dnew);
}

//Checkforout_of_rangeandlength_errorexceptions.
__try
{this->_S_copy_chars(_M_data(),__beg,__end);}
__catch(...)
{
_M_dispose();
__throw_exception_again;
}

_M_set_length(__dnew);
}

在上述代碼中,首先計(jì)算當(dāng)前字符串的實(shí)際長(zhǎng)度,如果長(zhǎng)度大于_S_local_capacity即15,那么則通過(guò)_M_create在堆上創(chuàng)建一塊內(nèi)存,最后通過(guò)_S_copy_chars函數(shù)進(jìn)行內(nèi)容拷貝。

結(jié)語(yǔ)

本文中的測(cè)試環(huán)境基于Centos6.8 & GCC5.4,也就是說(shuō)在本環(huán)境中,string中如果實(shí)際數(shù)據(jù)小于16個(gè)字節(jié),則在本地局部存儲(chǔ),而大于15字節(jié),則存儲(chǔ)在堆上,這也就是string的一個(gè)優(yōu)化特性SSO(Small String Optimization)。在查閱了相關(guān)資料,發(fā)現(xiàn)15字節(jié)的限制取決于編譯器和操作系統(tǒng),在fedora和red-hat中,字符串總是存儲(chǔ)在堆中(來(lái)自于網(wǎng)絡(luò),由于手邊缺少相關(guān)環(huán)境,所以未能驗(yàn)證,抱歉)。

好了,今天的文章就到這,我們下期見(jiàn)!



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • GCC
    GCC
    +關(guān)注

    關(guān)注

    0

    文章

    112

    瀏覽量

    26272
  • gdb
    gdb
    +關(guān)注

    關(guān)注

    0

    文章

    61

    瀏覽量

    13889
  • string
    +關(guān)注

    關(guān)注

    0

    文章

    41

    瀏覽量

    5058

原文標(biāo)題:string 性能優(yōu)化之存儲(chǔ):棧或者堆

文章出處:【微信號(hào):C語(yǔ)言與CPP編程,微信公眾號(hào):C語(yǔ)言與CPP編程】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Linux內(nèi)核伙伴系統(tǒng)內(nèi)存申請(qǐng)函數(shù)詳解:原理到實(shí)戰(zhàn)

    在 Linux 內(nèi)核中,內(nèi)存管理是整個(gè)系統(tǒng)穩(wěn)定運(yùn)行的基石,而伙伴系統(tǒng)(Buddy System) 作為內(nèi)核物理內(nèi)存分配的核心機(jī)制,更是驅(qū)動(dòng)開(kāi)發(fā)、內(nèi)核模塊開(kāi)發(fā)的必備知識(shí)點(diǎn)。它通過(guò) "2
    的頭像 發(fā)表于 02-10 16:58 ?3632次閱讀
    Linux內(nèi)核伙伴系統(tǒng)<b class='flag-5'>內(nèi)存</b>申請(qǐng)函數(shù)詳解:<b class='flag-5'>從</b>原理到實(shí)戰(zhàn)

    keil中c語(yǔ)言的動(dòng)態(tài)分配內(nèi)存

    、靜態(tài)區(qū),在內(nèi)存中還有‘堆’這樣的一個(gè)區(qū)域。其實(shí),這塊內(nèi)存就是用來(lái)動(dòng)態(tài)內(nèi)存分配的。 其實(shí)想一就知道光靠棧區(qū)和靜態(tài)區(qū)在處理問(wèn)題時(shí)是很不靈活的
    發(fā)表于 01-21 06:04

    【「Linux 設(shè)備驅(qū)動(dòng)開(kāi)發(fā)(第 2 版)」閱讀體驗(yàn)】+讀深入理解Linux內(nèi)核內(nèi)存分配

    ,對(duì)可訪問(wèn)的內(nèi)存地址空間越來(lái)越大,而以目前的內(nèi)存生產(chǎn)制造工藝不能滿足時(shí)下的AI終端產(chǎn)品的需求,因此短期內(nèi)造成內(nèi)存、硬盤(pán)等存儲(chǔ)設(shè)備價(jià)格瘋漲。 進(jìn)度的
    發(fā)表于 01-16 20:05

    操作系統(tǒng)運(yùn)行機(jī)制

    ,按截止時(shí)間控制運(yùn)行的實(shí)現(xiàn);在批處理系統(tǒng)中,通過(guò)時(shí)鐘管理來(lái)衡量一個(gè)作業(yè)的運(yùn)行程度等。因此,系統(tǒng)管理的方方面面無(wú)不依賴于時(shí)鐘。   2) 中斷機(jī)制   引入中斷技術(shù)的初衷是提高多道程序運(yùn)行環(huán)境中CPU
    發(fā)表于 01-15 07:12

    內(nèi)存拷貝函數(shù) memcpy原理及實(shí)現(xiàn)

    string.h頭文件里。自己實(shí)現(xiàn)的時(shí)候,最簡(jiǎn)單的方法是用指針按照字節(jié)順序復(fù)制即可。但是性能太低: 其一,一次一個(gè)字節(jié)效率太低,地址總線一般是32位,能搬運(yùn)4字節(jié),一次一個(gè)肯定慢的不行; 其二,當(dāng)
    發(fā)表于 12-26 08:03

    請(qǐng)問(wèn)休眠模式的定時(shí)喚醒機(jī)制如何實(shí)現(xiàn)?

    休眠模式的定時(shí)喚醒機(jī)制如何實(shí)現(xiàn)?
    發(fā)表于 12-24 07:58

    嵌入式系統(tǒng)中,動(dòng)態(tài)分配內(nèi)存可能發(fā)生的問(wèn)題是什么?

    盡管不像非嵌入式計(jì)算機(jī)那么常見(jiàn),嵌入式系統(tǒng)還是有堆(heap)中動(dòng)態(tài)分配內(nèi)存的過(guò)程的。 那么嵌入式系統(tǒng)中,動(dòng)態(tài)分配內(nèi)存可能發(fā)生的問(wèn)題是什
    發(fā)表于 12-22 09:42

    代碼執(zhí)行看單片機(jī)內(nèi)存分配

    是:根據(jù)程序計(jì)數(shù)器PC中的值程序存儲(chǔ)器讀出現(xiàn)行指令,送到指令寄存器。 分析指令階段的任務(wù)是:將指令寄存器中的指令操作碼取出后進(jìn)行譯碼,分析其指令性質(zhì)。如指令要求操作數(shù),則尋找操作數(shù)地址。 計(jì)算機(jī)執(zhí)行
    發(fā)表于 12-02 07:58

    rt-thread如何實(shí)現(xiàn)SLAAC(無(wú)狀態(tài)地址自動(dòng)分配)?

    大佬們,本菜鳥(niǎo)有一些網(wǎng)絡(luò)上的問(wèn)題需要幫助: RT-Thread 上如何實(shí)現(xiàn) SLAAC(無(wú)狀態(tài)地址自動(dòng)分配),給連接到我的板子的設(shè)備分配 IPv6 地址; RT-Thread 如何發(fā)送以太網(wǎng)報(bào)文,要求
    發(fā)表于 09-22 08:05

    如何 MCU/MPU 角度保護(hù)物聯(lián)網(wǎng)應(yīng)用?

    如何 MCU/MPU 角度保護(hù)物聯(lián)網(wǎng)應(yīng)用?
    發(fā)表于 09-08 07:33

    靈活高效雙引擎驅(qū)動(dòng):ZBUFF讓C語(yǔ)言內(nèi)存操作更智能!

    ZBUFF庫(kù)深度融合了智能內(nèi)存分配算法與實(shí)時(shí)監(jiān)測(cè)機(jī)制,能夠自動(dòng)適應(yīng)不同場(chǎng)景內(nèi)存需求。其自適應(yīng)碎片整理功能和錯(cuò)誤檢測(cè)模塊,不僅保障了
    的頭像 發(fā)表于 08-11 13:27 ?593次閱讀
    靈活高效雙引擎驅(qū)動(dòng):ZBUFF讓C語(yǔ)言<b class='flag-5'>內(nèi)存</b>操作更智能!

    RTOS怎么實(shí)現(xiàn)共享內(nèi)存?

    K230的RTOS支持POSIX標(biāo)準(zhǔn)的共享內(nèi)存嗎 我嘗試使用卻失敗 還是說(shuō)需要源碼部分配置的開(kāi)啟才可以使用 求教大佬
    發(fā)表于 08-04 08:06

    如何使用LAX_CODEGEN啟用動(dòng)態(tài)內(nèi)存分配?

    我目前正在探索NXP_MBDToolbox_LAX。lax_codegen 生成的代碼基于靜態(tài)分配。我想管理大型向量,如何使用 LAX_CODEGEN 啟用動(dòng)態(tài)內(nèi)存分配?
    發(fā)表于 04-10 08:09

    golang內(nèi)存分配

    作者:錢(qián)文 Go 的分配采用了類似 tcmalloc 的結(jié)構(gòu).特點(diǎn): 使用一小塊一小塊的連續(xù)內(nèi)存頁(yè), 進(jìn)行分配某個(gè)范圍大小的內(nèi)存需求. 比如某個(gè)連續(xù) 8KB 專門(mén)用于
    的頭像 發(fā)表于 03-31 15:00 ?516次閱讀
    golang<b class='flag-5'>內(nèi)存</b><b class='flag-5'>分配</b>

    永磁體磁角度偏差對(duì)電機(jī)性能影響的分析

    在精密電機(jī)制造過(guò)程中,磁鋼磁角度偏差對(duì)電機(jī)性能有一定影響,但是這種影響難以得到精確的評(píng)估。 針對(duì)電機(jī)設(shè)計(jì)中廣泛使用的平行充磁方式,采用Ansoft有限元軟件對(duì)磁鋼磁角度偏差引起的電機(jī)反電勢(shì)系 數(shù)
    發(fā)表于 03-25 15:37