C++中建立持久物件的方法

bzhxuexi發表於2013-11-28
        持久物件(persistent objects)廣泛應用於遊戲、分散式資料庫系統、多媒體以及圖形應用程式中。目前C++並不直接支援永續性(persistence)(但有一些在C++未來版本中新增永續性和反射(reflection)的建議)。持久物件可以在建立它的程式的作用域之外保持自身狀態。把物件寫入一個檔案並在以後重建之,或者把物件傳送到一臺遠端機器,就是這樣的例子。對永續性的支援並不象第一眼看上去那樣簡單,同一物件的大小和記憶體佈局在不同的平臺上可能並不相同,而不同的位元組次序(byte ordering),或稱為endian-ness,使事情更加複雜化。在下文中我將討論如何實現永續性,而無須求助於DCOM和 CORBA之類的第三方框架。對於小型和可移植的應用程式而言,這是一種有效並令人滿意的方案。

       序列化(serialization)基礎

       為了使一個物件持久存在,必須把它的狀態儲存在非易失的儲存裝置中。考慮一個錄製和播放MP3檔案的應用程式,每首單曲都表示為一個包含標題、唱片、歌手、時間、速率、錄製日期以及相應的 MP3檔案的物件,該應用程式在跟蹤列表中顯示最近播放的曲目。你的目標是通過序列化,也就是把物件寫入一個檔案,使MP3物件成為持久物件,同時通過反序列化(deserialization)在下一個 session中重建這些物件。

       序列化內建資料型別

       每個物件最終都由內建資料成員組成,如int, bool, char[]等等。你的第一個任務是把這樣的型別寫入一個輸出檔案流(ofstream)中。應用程式必須這些值儲存為相應的二進位制形式,基於這個目的,應使用write() 和read() 成員函式。write() 以某個變數的地址和大小為引數,把該變數的位模式寫入一個檔案流中。read() 的兩個引數為char*和long型別,分別指示記憶體緩衝區的地址和位元組大小。下面的例子演示如何在ofstream中儲存兩個整數:

       #include <fstream>

       using namespace std;

       int main()

       {

        int x,y; // mouse coordinates

 

        // ..assign values to x and y

        ofstream archive("coord.dat", ios::binary);

        archive.write(reinterpret_cast<char *>(&x), sizeof (x));

        archive.write(reinterpret_cast<char *>(&x), sizeof (x));

        archive.close();

       }

       使用reinterpret_cast<>是必要的,因為write()的第一個引數型別為const char*,但&x和&y是int*型別。

       以下程式碼讀取剛才儲存的值:

       #include <fstream>

       using namespace std;

       vint main()

       {

        int x,y;

        ifstream archive("coord.dat");

       archive.read((reinterpret_cast<char *>(&x), sizeof(x));

        archive.read((reinterpret_cast<char *>(&y), sizeof(y));

       }

       序列化物件

       要序列化一個完整的物件,應把每個資料成員寫入檔案中:

       class MP3_clip

       {

       private:


        std::time_t date;

        std::string name;

        int bitrate;

        bool stereo;

       public:

        void serialize();

        void deserialize();

        //..

       };

       void MP3_clip::serialize()

       {

       {

        int size=name.size();// store name's length

        //empty file if it already exists before writing new data

        ofstream arc("mp3.dat", ios::binary|ios::trunc);

        arc.write(reinterpret_cast<char *>(&date),sizeof(date));

        arc.write(reinterpret_cast<char *>(&size),sizeof(size));

        arc.write(name.c_str(), size+1); // write final '\0' too

        arc.write(reinterpret_cast<char *>(&bitrate),

        sizeof(bitrate));

        arc.write(reinterpret_cast<char *>(&stereo),

        sizeof(stereo));

       }


       實現deserialize() 需要一些技巧,因為你需要為字串分配一個臨時緩衝區。做法如下:

       void MP3_clip::deserialize()

       {

        ifstream arce("mp3.dat");

        int len=0;

        char *p=0;

        arc.read(reinterpret_cast<char *>(&date), sizeof(date));

        arc.read(reinterpret_cast<char *>(&len), sizeof(len));

        p=new char [len+1]; // allocate temp buffer for name

        arc.read(p, len+1); // copy name to temp, includin

        g '\0'

        name=p; // copy temp to data member

        delete[] p;

        arc.read(reinterpret_cast<char *>(&bitrate),

        sizeof(bitrate));

        arc.read(reinterpret_cast<char *>(&stereo),

        sizeof(stereo));

       }

       效能優化

       你可能會感到迷惑,為什麼不把整個物件一次性轉儲到檔案中,而必須對每個資料成員進行序列化呢?換句話說,難道不能用下面的方式實現serialize() 嗎?

       void MP3_clip::serialize()

       {


        ofstream arc("mp3.dat", ios::binary|ios::trunc);

        arc.write(reinterpret_cast<char *>(this),sizeof(*this));

       }

       不行,不能這樣做。這種方式至少存在兩個問題。通常,當被序列化的物件還包含其它一些物件時,你不能簡單地把該物件轉儲到一個檔案中並指望以後從中重建一個有效的物件。在我們的例子中,外層物件包含一個std::string成員,一個淺拷貝(shallow copy)操作會把std::string成員歸檔,但其值是時變的,意思是說每次執行程式時都可能改變。更糟的是,由於std::string事實上並不包含一個字元陣列,而是一個指標,使用淺拷貝試圖重建原始字串是不可能的。為克服這個問題,程式沒有序列化string物件,而是歸檔其含有的字元和長度。一般來說,指標,陣列和控制程式碼應以相同的方式進行處理。

       另一個問題設計到多型物件。每個多型物件都含有一個vtpr,即一個指向虛擬函式地址分配表的隱藏指標。vtpr的值是時變的,如果你把整個多型物件轉儲到一個檔案中,然後強行把歸檔後的資料新增到一個新的物件上,則其vptr可能無效並導致未定義的行為。再次提醒,解決方案是隻對非時變的資料成員進行序列化和反序列化。另一種方法是計算vptr的確切偏移量,在從檔案重建物件時不要動它。記住,vptr的位置是與實現相關的,因此這樣的程式碼是不可移植的。

 

相關文章