[OOD-More C++ Idioms] 寫時拷貝 (Copy on Write)

Horky發表於2015-10-31

目的

達到延遲拷貝(lazy copy)的優化目的。和延遲初始化(lazy initialization)相似, 選擇在恰當的時機更加有效。

別名

  • COW (copy-on-write)
  • Lazy copy

動機

拷貝物件有時會帶來效能損失(performance penalty)。如果物件經常拷來拷去,但以很少修改,copy-on-write就能明顯地提升效能。為了實現copy-on-write, 需要使用一個智慧指標將真正的物件值封裝起來,每次修改時都要檢查一下物件的引用計數。如果物件被多次引用,就在修改前建立一個複本。

解決方案及示例

#ifndef COWPTR_HPP
#define COWPTR_HPP

#include <memory>

template <class T>
class CowPtr
{
    public:
        typedef std::shared_ptr<T> RefPtr;

    private:
        RefPtr m_sp;

        void detach()
        {
            T* tmp = m_sp.get();
            if( !( tmp == 0 || m_sp.unique() ) ) {
                m_sp = RefPtr( new T( *tmp ) );
            }
        }

    public:
        CowPtr(T* t)
            :   m_sp(t)
        {}
        CowPtr(const RefPtr& refptr)
            :   m_sp(refptr)
        {}
        const T& operator*() const
        {
            return *m_sp;
        }
        T& operator*()
        {
            detach();
            return *m_sp;
        }
        const T* operator->() const
        {
            return m_sp.operator->();
        }
        T* operator->()
        {
            detach();
            return m_sp.operator->();
        }
};

#endif
譯註:原文程式碼使用boost庫,都改為std的實現了。

這是一個簡單的實現版本。除了必須通過智慧指標解引用(dereferencing)來引用其內部物件有點不太方便外,還至少有一個缺點:類可以返回內部狀態的引用:
char & String::operator[](int)
這樣會帶有一些無法預期的行為。

考慮下面的程式碼段:

CowPtr<std::string> s1 = new std::string("Hello");
char &c = s1->operator[](4); // 非常量的detach操作什麼也不做
CowPtr<std::string> s2(s1); // 延遲拷貝,共享的狀態
c = '!'; // 悲催啦

最後一行原本要修改原始的字串s1, 而不是它的複本s2,而事實上s2也被修改了。

一個比較好的做法是寫一個自定義的copy-on-write實現,封裝需要延時拷貝(lazy-copy)的類,並且保持對使用者透明。為了解決上面的問題,可以標記物件為”不可共享(unshareable)”狀態表示已經交出了對記憶體物件的引用,也就是強制進行深度拷貝。進一步優化,可以在那些不會放棄內部物件引用的non-const操作後恢復為”共享(shareable)”狀態,(比如, `void string::clear())),因為客戶端程式碼期望這些引用都會失效。

譯註:這一部分說得不清楚。標記物件為不可共享,比如上面例子中,取出字元c後設為不可共享,再建構s2時直接進行深拷貝。另外說在non-const操作沒有放棄內部物件,指的是這類操作建立了一個複本,這時候的原來的物件可以更新為shareable。

已知的應用

相關的慣用法

參考


更多翻譯內容請訪問Github專案

相關文章