C++ string的內部究竟是什麼樣的？

RioTian發表於2021-01-02

原文網址 : https://www.cnblogs.com/RioTian/p/14224419.html

在C語言中，有兩種方式表示字串：

一種是用字元陣列來容納字串，例如char str[10] = "abc"，這樣的字串是可讀寫的；
一種是使用字串常量，例如char *str = "abc"，這樣的字串只能讀，不能寫。

兩種形式總是以\0作為結束標誌。

C++ string 與它們在C語言中的前身截然不同。首先，也是最重要的不同點，C++ string 隱藏了它所包含的字元序列的物理表示。程式設計人員不必關心陣列的維數或\0方面的問題。

string 在內部封裝了與記憶體和容量有關的資訊。具體地說，C++ string 物件知道自己在記憶體中的開始位置、包含的字元序列以及字元序列長度；當記憶體空間不足時，string 還會自動調整，讓記憶體空間增長到足以容納下所有字元序列的大小。

C++ string 的這種做法，極大地減少了C語言程式設計中三種最常見且最具破壞性的錯誤：

陣列越界；
通過未被初始化或者被賦以錯誤值的指標來訪問陣列元紊；
釋放了陣列所佔記憶體，但是仍然保留了“懸空”指標。

C++ 標準沒有定義 string 類的記憶體佈局，各個編譯器廠商可以提供不同的實現，但必須保證 string 的行為一致。採用這種做法是為了獲得足夠的靈活性。

特別是，C++ 標準沒有定義在哪種確切的情況下應該為 string 物件分配記憶體空間來儲存字元序列。string 記憶體分配規則明確規定：允許但不要求以引用計數（reference counting）的方式實現。但無論是否採用引用計數，其語義都必須一致。

C++ 的這種做法和C語言不同，在C語言中，每個字元型陣列都佔據各自的物理儲存區。在 C++ 中，獨立的幾個 string 物件可以佔據也可以不佔據各自特定的物理儲存區，但是，如果採用引用計數避免了儲存同一資料的拷貝副本，那麼各個獨立的物件（在處理上）必須看起來並表現得就像獨佔地擁有各自的儲存區一樣。例如：

// #include<bits/stdc++.h>
#include <iostream>
#include <string>
using namespace std;

int main() {
    string s1("12345");
    string s2 = s1;
    cout << (s1 == s2) << endl;
    s1[0] = '6';
    cout << "s1 = " << s1 << endl;  // 62345
    cout << "s2 = " << s2 << endl;  // 12345
    cout << (s1 == s2) << endl;

    return 0;
}

在 GCC 下的執行結果：

只有當字串被修改的時候才建立各自的拷貝，這種實現方式稱為寫時複製（copy-on-write）策略。當字串只是作為值引數（value parameter）或在其他只讀情形下使用，這種方法能夠節省時間和空間。

不論一個庫的實現是不是採用引用計數，它對 string 類的使用者來說都應該是透明的。遺憾的是，情況並不總是這樣。在多執行緒程式中，幾乎不可能安全地使用引用計數來實現。

內部類是什麼？匿名內部類又是什麼？
2020-11-13
java培訓教程：什麼是匿名內部類?怎樣建立匿名內部類?
2021-10-22
Java
java內部類，為什麼需要內部類？
2018-10-31
Java
重達10公斤的iPhone X手機殼造型究竟是什麼樣的
2018-05-19
iPhone
最近大火的「元宇宙」究竟是什麼
2021-11-07
元宇宙
人人都在談的Metaverse，究竟是什麼？
2021-05-31
Metaverse
軟體測試也出現內捲了？！測試行業的內卷究竟是什麼？
2021-07-21
行業
# Apache SeaTunnel 究竟是什麼？
2024-03-29
Apache
C++ 額外的 string 操作
2024-10-03
C++
IDP中的黃金路徑究竟是什麼？
2023-05-05
HTML5培訓究竟是學的什麼?
2019-08-19
HTML
[原始碼解析] Flink的Slot究竟是什麼？(2)
2020-09-04
原始碼
恐怖遊戲究竟是用什麼嚇到你的？
2019-12-27
遊戲
[原始碼解析] Flink的Slot究竟是什麼？(1)
2020-08-24
原始碼
鋪天蓋地的「雲原生」究竟是什麼？
2021-11-09
CDN加速究竟是怎麼加速的？其工作原理是怎樣的？
2021-11-01
chmod 755 究竟是什麼鬼？
2018-10-08
[轉]DevOps究竟是什麼鬼？
2018-04-20
dev
市場聞之色變的DMA究竟是什麼
2024-05-31
Python中的類、模組和包究竟是什麼?
2021-10-15
Python
CNN、RNN、DNN的內部網路結構有什麼區別？
2019-06-09
CNNRNNDNN
面試官：Redis中列表的內部實現方式是什麼？
2022-03-11
面試Redis
面試官：Redis中字串的內部實現方式是什麼？
2022-03-08
面試Redis字串
暴雪內部是怎樣看待《守望先鋒2》的？
2020-01-03
Node.js 中的緩衝區（Buffer）究竟是什麼？
2019-07-25
Node.js
最近很火的低程式碼開發究竟是什麼？
2020-08-12
伺服器究竟是什麼呢？
2020-07-27
伺服器
面試官：Redis中有序集合的內部實現方式是什麼？
2022-03-13
面試Redis
[Java基礎]String 為什麼是不可變的?
2024-07-29
Java
CDN加速是什麼樣的
2022-12-21
茶葉什麼樣的好喝?
2021-02-05
螢幕上內容究竟是怎樣畫出來的 —— Android View 工作原理詳解
2019-03-04
AndroidView
EA高管所說的“驚喜機制”究竟是什麼？
2019-09-12
鐳速傳輸：不是格鬥術的MFT究竟是什麼？
2020-06-24
你認為企業內部協同工具最重要的功能是什麼？
2024-12-06
C++ 類的記憶體分配是怎麼樣的？
2024-03-24
C++記憶體
什麼是.NET的強型別字串(Strongly typed string)？
2024-11-29
型別字串
MySQL什麼時候會使用內部臨時表?
2019-05-24
MySql

C++ string的內部究竟是什麼樣的？

相關文章