為什麼多執行緒讀寫shared_ptr需要加鎖
陳碩(giantchen_AT_gmail_DOT_com)
2012-01-28
最新版下載:http://chenshuo.googlecode.com/files/CppEngineering.pdf
我在《Linux 多執行緒服務端程式設計:使用 muduo C++ 網路庫》第 1.9 節“再論 shared_ptr 的執行緒安全”中寫道:
(shared_ptr)的引用計數本身是安全且無鎖的,但物件的讀寫則不是,因為 shared_ptr 有兩個資料成員,讀寫操作不能原子化。根據文件(http://www.boost.org/doc/libs/release/libs/smart_ptr/shared_ptr.htm#ThreadSafety), shared_ptr 的執行緒安全級別和內建型別、標準庫容器、std::string 一樣,即:
• 一個 shared_ptr 物件實體可被多個執行緒同時讀取(文件例1);
• 兩個 shared_ptr 物件實體可以被兩個執行緒同時寫入(例2),“析構”算寫操作;
• 如果要從多個執行緒讀寫同一個 shared_ptr 物件,那麼需要加鎖(例3~5)。
請注意,以上是 shared_ptr 物件本身的執行緒安全級別,不是它管理的物件的執行緒安全級別。
後文(p.18)則介紹如何高效地加鎖解鎖。本文則具體分析一下為什麼“因為 shared_ptr 有兩個資料成員,讀寫操作不能原子化”使得多執行緒讀寫同一個 shared_ptr 物件需要加鎖。這個在我看來顯而易見的結論似乎也有人抱有疑問,那將導致災難性的後果,值得我寫這篇文章。本文以 boost::shared_ptr 為例,與 std::shared_ptr 可能略有區別。
shared_ptr 的資料結構
shared_ptr 是引用計數型(reference counting)智慧指標,幾乎所有的實現都採用在堆(heap)上放個計數值(count)的辦法(除此之外理論上還有用迴圈連結串列的辦法,不過沒有例項)。具體來說,shared_ptr<Foo> 包含兩個成員,一個是指向 Foo 的指標 ptr,另一個是 ref_count 指標(其型別不一定是原始指標,有可能是 class 型別,但不影響這裡的討論),指向堆上的 ref_count 物件。ref_count 物件有多個成員,具體的資料結構如圖 1 所示,其中 deleter 和 allocator 是可選的。
圖 1:shared_ptr 的資料結構。
為了簡化並突出重點,後文只畫出 use_count 的值:
以上是 shared_ptr<Foo> x(new Foo); 對應的記憶體資料結構。
如果再執行 shared_ptr<Foo> y = x; 那麼對應的資料結構如下。
但是 y=x 涉及兩個成員的複製,這兩步拷貝不會同時(原子)發生。
中間步驟 1,複製 ptr 指標:
中間步驟 2,複製 ref_count 指標,導致引用計數加 1:
步驟1和步驟2的先後順序跟實現相關(因此步驟 2 裡沒有畫出 y.ptr 的指向),我見過的都是先1後2。
既然 y=x 有兩個步驟,如果沒有 mutex 保護,那麼在多執行緒裡就有 race condition。
多執行緒無保護讀寫 shared_ptr 可能出現的 race condition
考慮一個簡單的場景,有 3 個 shared_ptr<Foo> 物件 x、g、n:
- shared_ptr<Foo> g(new Foo); // 執行緒之間共享的 shared_ptr
- shared_ptr<Foo> x; // 執行緒 A 的區域性變數
- shared_ptr<Foo> n(new Foo); // 執行緒 B 的區域性變數
一開始,各安其事。
執行緒 A 執行 x = g; (即 read g),以下完成了步驟 1,還沒來及執行步驟 2。這時切換到了 B 執行緒。
同時程式設計 B 執行 g = n; (即 write g),兩個步驟一起完成了。
先是步驟 1:
再是步驟 2:
這是 Foo1 物件已經銷燬,x.ptr 成了空懸指標!
最後回到執行緒 A,完成步驟 2:
多執行緒無保護地讀寫 g,造成了“x 是空懸指標”的後果。這正是多執行緒讀寫同一個 shared_ptr 必須加鎖的原因。
當然,race condition 遠不止這一種,其他執行緒交織(interweaving)有可能會造成其他錯誤。
思考,假如 shared_ptr 的 operator= 實現是先複製 ref_count(步驟 2)再複製 ptr(步驟 1),會有哪些 race condition?
雜項
shared_ptr 作為 unordered_map 的 key
如果把 boost::shared_ptr 放到 unordered_set 中,或者用於 unordered_map 的 key,那麼要小心 hash table 退化為連結串列。http://stackoverflow.com/questions/6404765/c-shared-ptr-as-unordered-sets-key/12122314#12122314
直到 Boost 1.47.0 釋出之前,unordered_set<std::shared_ptr<T> > 雖然可以編譯通過,但是其 hash_value 是 shared_ptr 隱式轉換為 bool 的結果。也就是說,如果不自定義hash函式,那麼 unordered_{set/map} 會退化為連結串列。https://svn.boost.org/trac/boost/ticket/5216
Boost 1.51 在 boost/functional/hash/extensions.hpp 中增加了有關過載,現在只要包含這個標頭檔案就能安全高效地使用 unordered_set<std::shared_ptr> 了。
這也是 muduo 的 examples/idleconnection 示例要自己定義 hash_value(const boost::shared_ptr<T>& x) 函式的原因(書第 7.10.2 節,p.255)。因為 Debian 6 Squeeze、Ubuntu 10.04 LTS 裡的 boost 版本都有這個 bug。
為什麼圖 1 中的 ref_count 也有指向 Foo 的指標?
shared_ptr<Foo> sp(new Foo) 在構造 sp 的時候捕獲了 Foo 的析構行為。實際上 shared_ptr.ptr 和 ref_count.ptr 可以是不同的型別(只要它們之間存在隱式轉換),這是 shared_ptr 的一大功能。分 3 點來說:
1. 無需虛析構;假設 Bar 是 Foo 的基類,但是 Bar 和 Foo 都沒有虛析構。
shared_ptr<Foo> sp1(new Foo); // ref_count.ptr 的型別是 Foo*
shared_ptr<Bar> sp2 = sp1; // 可以賦值,自動向上轉型(up-cast)
sp1.reset(); // 這時 Foo 物件的引用計數降為 1
此後 sp2 仍然能安全地管理 Foo 物件的生命期,並安全完整地釋放 Foo,因為其 ref_count 記住了 Foo 的實際型別。
2. shared_ptr<void> 可以指向並安全地管理(析構或防止析構)任何物件;muduo::net::Channel class 的 tie() 函式就使用了這一特性,防止物件過早析構,見書 7.15.3 節。
shared_ptr<Foo> sp1(new Foo); // ref_count.ptr 的型別是 Foo*
shared_ptr<void> sp2 = sp1; // 可以賦值,Foo* 向 void* 自動轉型
sp1.reset(); // 這時 Foo 物件的引用計數降為 1
此後 sp2 仍然能安全地管理 Foo 物件的生命期,並安全完整地釋放 Foo,不會出現 delete void* 的情況,因為 delete 的是 ref_count.ptr,不是 sp2.ptr。
3. 多繼承。假設 Bar 是 Foo 的多個基類之一,那麼:
shared_ptr<Foo> sp1(new Foo);
shared_ptr<Bar> sp2 = sp1; // 這時 sp1.ptr 和 sp2.ptr 可能指向不同的地址,因為 Bar subobject 在 Foo object 中的 offset 可能不為0。
sp1.reset(); // 此時 Foo 物件的引用計數降為 1
但是 sp2 仍然能安全地管理 Foo 物件的生命期,並安全完整地釋放 Foo,因為 delete 的不是 Bar*,而是原來的 Foo*。換句話說,sp2.ptr 和 ref_count.ptr 可能具有不同的值(當然它們的型別也不同)。
為什麼要儘量使用 make_shared()?
為了節省一次記憶體分配,原來 shared_ptr<Foo> x(new Foo); 需要為 Foo 和 ref_count 各分配一次記憶體,現在用 make_shared() 的話,可以一次分配一塊足夠大的記憶體,供 Foo 和 ref_count 物件容身。資料結構是:
不過 Foo 的建構函式引數要傳給 make_shared(),後者再傳給 Foo::Foo(),這隻有在 C++11 裡通過 perfect forwarding 才能完美解決。
(.完.)
原文地址:http://blog.csdn.net/solstice/article/details/8547547
相關文章
- LINUX多執行緒讀寫同一個檔案 加鎖Linux執行緒
- 多執行緒與併發----讀寫鎖執行緒
- shared_ptr實現多執行緒讀寫copy-on-write執行緒
- 執行緒池管理(1)-為什麼需要執行緒池執行緒
- 為什麼 ConcurrentHashMap 的讀操作不需要加鎖?HashMap
- redis為什麼用單執行緒不用多執行緒Redis執行緒
- threading多執行緒資源加鎖thread執行緒
- 多執行緒系列(十一) -淺析併發讀寫鎖StampedLock執行緒
- GCD 多執行緒安全 單寫多讀GC執行緒
- 多執行緒_鎖執行緒
- 什麼是多執行緒?Python多執行緒有什麼優勢?執行緒Python
- python 多執行緒為什麼雞肋?Python執行緒
- Java多執行緒(2)執行緒鎖Java執行緒
- 【從0開始編寫webserver·基礎篇#01】為什麼需要執行緒池?寫一個執行緒池吧WebServer執行緒
- iOS底層原理 多執行緒之安全鎖以及常用的讀寫鎖 --(11)iOS執行緒
- Linux執行緒之讀寫鎖小結Linux執行緒
- 為什麼多執行緒可以利用到多核?執行緒
- Java 共享資料讀寫(多執行緒)Java執行緒
- java多執行緒中的死鎖、活鎖、飢餓、無鎖都是什麼鬼?Java執行緒
- 為什麼dispatch_sync在主執行緒會死鎖執行緒
- 【C/C++多執行緒程式設計之九】pthread讀寫鎖C++執行緒程式設計thread
- Java多執行緒13:讀寫鎖和兩種同步方式的對比Java執行緒
- iOS多執行緒安全-13種執行緒鎖?iOS執行緒
- 多執行緒(2)-執行緒同步互斥鎖Mutex執行緒Mutex
- java多執行緒–同步鎖Java執行緒
- Java多執行緒-無鎖Java執行緒
- 多執行緒之死鎖就是這麼簡單執行緒
- linux多執行緒-----同步機制(互斥量、讀寫鎖、條件變數)Linux執行緒變數
- 為什麼有人說 Python 多執行緒是雞肋?Python執行緒
- 多執行緒的這些鎖知道嗎?手寫一個自旋鎖?執行緒
- python為什麼要用執行緒Python執行緒
- 為什麼要使用執行緒池執行緒
- Java多執行緒(五):死鎖Java執行緒
- java多執行緒(5)死鎖Java執行緒
- Python 多執行緒和鎖Python執行緒
- Java多執行緒7:死鎖Java執行緒
- 多執行緒鎖的問題執行緒
- 【多執行緒與高併發】Java守護執行緒是什麼?什麼是Java的守護執行緒?執行緒Java