C#.NET 中的型別轉換 zt

asword發表於2007-03-09
C# 出來也有些日子了,最近由於程式設計的需要,對 C# 的型別轉換做了一些研究,其內容涉及 C# 的裝箱/拆箱/別名、數值型別間相互轉換、字元的 ASCII 碼和 Unicode 碼、數值字串和數值之間的轉換、字串和字元陣列/位元組陣列之間的轉換、各種數值型別和位元組陣列之間的轉換、十六進位制數輸出以及日期型資料的一些轉換處理
[@more@]
C# 出來也有些日子了,最近由於程式設計的需要,對 C# 的型別轉換做了一些研究,其內容涉及 C# 的裝箱/拆箱/別名、數值型別間相互轉換、字元的 ASCII 碼和 Unicode 碼、數值字串和數值之間的轉換、字串和字元陣列/位元組陣列之間的轉換、各種數值型別和位元組陣列之間的轉換、十六進位制數輸出以及日期型資料的一些轉換處理,在這裡與大家分享——

1. 裝箱、拆箱還是別名

  許多 C#.NET 的書上都有介紹 int -> Int32 是一個裝箱的過程,反之則是拆箱的過程。許多其它變數型別也是如此,如:short Int16,long Int64 等。對於一般的程式設計師來說,大可不必去了解這一過程,因為這些裝箱和拆箱的動作都是可以自動完成的,不需要寫程式碼進行干預。但是我們需要記住這些型別之間的關係,所以,我們使用“別名”來記憶它們之間的關係。
C# 是全物件導向的語言,比 Java 的物件導向都還徹底——它把簡單資料型別透過預設的裝箱動作封裝成了類。Int32、Int16、Int64 等就是相應的類名,而那些我們熟悉的、簡單易記的名稱,如 int、short、long 等,我們就可以把它稱作是 Int32、Int16、Int64 等型別的別名。
  那麼除了這三種型別之外,還有哪些類有“別名”呢?常用的有如下一些:

bool -> System.Boolean (布林型,其值為 true 或者 false)
char -> System.Char (字元型,佔有兩個位元組,表示 1 個 Unicode 字元)
byte -> System.Byte (位元組型,佔 1 位元組,表示 8 位正整數,範圍 0 ~ 255)
sbyte -> System.SByte (帶符號位元組型,佔 1 位元組,表示 8 位整數,範圍 -128 ~ 127)
ushort -> System.UInt16 (無符號短整型,佔 2 位元組,表示 16 位正整數,範圍 0 ~ 65,535)
uint -> System.UInt32 (無符號整型,佔 4 位元組,表示 32 位正整數,範圍 0 ~ 4,294,967,295)
ulong -> System.UInt64 (無符號長整型,佔 8 位元組,表示 64 位正整數,範圍 0 ~ 大約 10 的 20 次方)
short -> System.Int16 (短整型,佔 2 位元組,表示 16 位整數,範圍 -32,768 ~ 32,767)
int -> System.Int32 (整型,佔 4 位元組,表示 32 位整數,範圍 -2,147,483,648 到 2,147,483,647)
long -> System.Int64 (長整型,佔 8 位元組,表示 64 位整數,範圍大約 -(10 的 19) 次方 到 10 的 19 次方)
float -> System.Single (單精度浮點型,佔 4 個位元組)
double -> System.Double (雙精度浮點型,佔 8 個位元組)

  我們可以用下列程式碼做一個實驗:

private void TestAlias() {
    // this.textBox1 是一個文字框,型別為 System.Windows.Forms.TextBox
    // 設計中已經將其 Multiline 屬性設定為 true
    byte a = 1; char b = 'a'; short c = 1;
    int d = 2; long e = 3; uint f = 4; bool g = true;
    this.textBox1.Text = "";
    this.textBox1.AppendText("byte -> " + a.GetType().FullName + "n");
    this.textBox1.AppendText("char -> " + b.GetType().FullName + "n");
    this.textBox1.AppendText("short -> " + c.GetType().FullName + "n");
    this.textBox1.AppendText("int -> " + d.GetType().FullName + "n");
    this.textBox1.AppendText("long -> " + e.GetType().FullName + "n");
    this.textBox1.AppendText("uint -> " + f.GetType().FullName + "n");
    this.textBox1.AppendText("bool -> " + g.GetType().FullName + "n");
}

  在窗體中新建一個按鈕,並在它的單擊事件中呼叫該 TestAlias() 函式,我們將看到執行結果如下:

byte -> System.Byte
char -> System.Char
short -> System.Int16
int -> System.Int32
long -> System.Int64
uint -> System.UInt32
bool -> System.Boolean

  這足以說明各別名對應的類!

2. 數值型別之間的相互轉換

  這裡所說的數值型別包括 byte, short, int, long, fload, double 等,根據這個排列順序,各種型別的值依次可以向後自動進行轉換。舉個例來說,把一個 short 型的資料賦值給一個 int 型的變數,short 值會自動行轉換成 int 型值,再賦給 int 型變數。如下例:

private void TestBasic() {
    byte a = 1; short b = a; int c = b;
    long d = c; float e = d; double f = e;
    this.textBox1.Text = "";
    this.textBox1.AppendText("byte a = " + a.ToString() + "n");
    this.textBox1.AppendText("short b = " + b.ToString() + "n");
    this.textBox1.AppendText("int c = " + c.ToString() + "n");
    this.textBox1.AppendText("long d = " + d.ToString() + "n");
    this.textBox1.AppendText("float e = " + e.ToString() + "n");
    this.textBox1.AppendText("double f = " + f.ToString() + "n");
}

  譯順利透過,執行結果是各變數的值均為 1;當然,它們的型別分別還是 System.Byte 型……System.Double 型。現在我們來試試,如果把賦值的順序反過來會怎麼樣呢?在 TestBasic() 函式中追加如下語句:

int g = 1;
short h = g;
this.textBox1.AppendText("h = " + h.ToString() + "n");

  結果編譯報錯:
  G:ProjectsVisual C#ConvertForm1.cs(118): 無法將型別“int”隱式轉換為“short”
  其中,Form1.cs 的 118 行即 short h = g 所在行。

  這個時候,如果我們堅持要進行轉換,就應該使用強制型別轉換,這在 C 語言中常有提及,就是使用“(型別名) 變數名”形式的語句來對資料進行強制轉換。如上例修改如下:

short g = 1;
byte h = (byte) g; // 將 short 型的 g 的值強制轉換成 short 型後再賦給變數 h
this.textBox1.AppendText("h = " + h.ToString() + "n");

  編譯透過,執行結果輸出了 h = 1,轉換成功。
  但是,如果我們使用強制轉換,就不得不再考慮一個問題:short 型的範圍是 -32768 ~ 23767,而 byte 型的範圍是 0 ~ 255,那麼,如果變數 g 的大小超過了 byte 型的範圍又會出現什麼樣的情況呢?我們不妨再一次改寫程式碼,將值改為 265,比 255 大 10

short g = 265; //265 = 255 + 10
byte h = (byte) g;
this.textBox1.AppendText("h = " + h.ToString() + "n");

  編譯沒有出錯,執行結果卻不是 h = 265,而是 h = 9。
因此,我們在進行轉換的時候,應當注意被轉換的資料不能超出目標型別的範圍。這不僅體現在多位元組資料型別(相對,如上例的 short) 轉換為少位元組型別(相對,如上例的 byte) 時,也體現在位元組數相同的有符號型別和無符號型別之間,如將 byte 的 129 轉換為 sbyte 就會溢位。這方面的例子大同小異,就不詳細說明了。

3. 字元的 ASCII 碼和 Unicode 碼

  很多時候我們需要得到一個英文字元的 ASCII 碼,或者一個漢字字元的 Unicode 碼,或者從相關的編碼查詢它是哪一個字元的編碼。很多人,尤其是從 VB 程式序轉過來學 C# 的人,會報怨 C# 裡為什麼沒有提供現成的函式來做這個事情——因為在 VB 中有 Asc() 函式和 Chr() 函式用於這類轉換。
但是如果你學過 C,你就會清楚,我們只需要將英文字元型資料強制轉換成合適的數值型資料,就可以得到相應的 ASCII 碼;反之,如果將一個合適的數值型資料強制轉換成字元型資料,就可以得到相應的字元。
C# 中字元的範圍擴大了,不僅包含了單位元組字元,也可以包含雙位元組字元,如中文字元等。而在字元和編碼之間的轉換,則仍延用了 C 語言的做法——強制轉換。不妨看看下面的例子

private void TestChar() {
    char ch = 'a'; short ii = 65;
    this.textBox1.Text = "";
    this.textBox1.AppendText("The ASCII code of '" + ch + "' is: " + (short) ch + "n");
    this.textBox1.AppendText("ASCII is " + ii.ToString() + ", the char is: " + (char) ii + "n");
    char cn = '中'; short uc = 22478;
    this.textBox1.AppendText("The Unicode of '" + cn + "' is: " + (short) cn + "n");
    this.textBox1.AppendText("Unicode is " + uc.ToString() + ", the char is: " + (char) uc + "n");
}

  它的執行結果是

The ASCII code of 'a' is: 97
ASCII is 65, the char is: A
The Unicode of '中' is: 20013
Unicode is 22478, the char is: 城

  從這個例子中,我們便能非常清楚的瞭解——透過強制轉換,可以得以字元的編碼,或者得到編碼表示的字元。如果你需要的不是 short 型的編碼,請參考第 1 條進行轉換,即可得到 int 等型別的編碼值。

4. 數值字串和數值之間的轉換

  首先,我們得搞明白,什麼是數值字串。我們知道,在 C# 中,字串是用一對雙引號包含的若干字元來表示的,如 "123"。而 "123" 又相對特殊,因為組成該字串的字元都是數字,這樣的字串,就是數值字串。在我們的眼中,這即是一串字元,也是一個數,但計算機卻只認為它是一個字串,不是數。因此,我們在某些時候,比如輸入數值的時候,把字串轉換成數值;而在另一些時候,我們需要相反的轉換。
  將數值轉換成字串非常簡單,因為每一個類都有一個 void ToString() 方法。所有數值型的 void ToString() 方法都能將資料轉換為數值字串。如 123.ToSting() 就將得到字串 "123"。
那麼反過來,將數值型字串轉換成數值又該怎麼辦呢?我們仔細查詢一下,會發現 short, int, float 等數值型別均有一個 static Parse() 函式。這個函式就是用來將字串轉換為相應數值的。我們以一個 float 型別的轉換為例: float f = float.Parse("543.21"); 其結果 f 的值為 543.21F。當然,其它的數值型別也可以使用同樣的方法進行轉換,下面的例子可以更明確的說明轉換的方法:

private void TestStringValue() {
    float f = 54.321F;
    string str = "123";
    this.textBox1.Text = "";
    this.textBox1.AppendText("f = " + f.ToString() + "n");
    if (int.Parse(str) == 123) {
        this.textBox1.AppendText("str convert to int successfully.");
    } else {
        this.textBox1.AppendText("str convert to int failed.");
    }
}

  執行結果:

f = 54.321
str convert to int successfully.

5. 字串和字元陣列之間的轉換

  字串類 System.String 提供了一個 void ToCharArray() 方法,該方法可以實現字串到字元陣列的轉換。如下例:

private void TestStringChars() {
    string str = "mytest";
    char[] chars = str.ToCharArray();
    this.textBox1.Text = "";
    this.textBox1.AppendText("Length of "mytest" is " + str.Length + "n");
    this.textBox1.AppendText("Length of char array is " + chars.Length + "n");
    this.textBox1.AppendText("char[2] = " + chars[2] + "n");
}

  例中以對轉換轉換到的字元陣列長度和它的一個元素進行了測試,結果如下:

Length of "mytest" is 6
Length of char array is 6
char[2] = t

  可以看出,結果完全正確,這說明轉換成功。那麼反過來,要把字元陣列轉換成字串又該如何呢?
  我們可以使用 System.String 類的建構函式來解決這個問題。System.String 類有兩個建構函式是透過字元陣列來構造的,即 String(char[]) 和 String[char[], int, int)。後者之所以多兩個引數,是因為可以指定用字元陣列中的哪一部分來構造字串。而前者則是用字元陣列的全部元素來構造字串。我們以前者為例,在 TestStringChars() 函式中輸入如下語句:

char[] tcs = {'t', 'e', 's', 't', ' ', 'm', 'e'};
string tstr = new String(tcs);
this.textBox1.AppendText("tstr = "" + tstr + ""n");

  執行結果輸入 tstr = "test me",測試說明轉換成功。
  實際上,我們在很多時候需要把字串轉換成字元陣列只是為了得到該字串中的某個字元。如果只是為了這個目的,那大可不必興師動眾的去進行轉換,我們只需要使用 System.String 的 [] 運算子就可以達到目的。請看下例,再在 TestStringChars() 函式中加入如如下語名:

char ch = tstr[3];
this.textBox1.AppendText(""" + tstr + ""[3] = " + ch.ToString());

  正確的輸出是 "test me"[3] = t,經測試,輸出正確。

6. 字串和位元組陣列之間的轉換

  如果還想從 System.String 類中找到方法進行字串和位元組陣列之間的轉換,恐怕你會失望了。為了進行這樣的轉換,我們不得不借助另一個類:System.Text.Encoding。該類提供了 bye[] GetBytes(string) 方法將字串轉換成位元組陣列,還提供了 string GetString(byte[]) 方法將位元組陣列轉換成字串。
  System.Text.Encoding 類似乎沒有可用的建構函式,但我們可以找到幾個預設的 Encoding,即 Encoding.Default(獲取系統的當前 ANSI 內碼表的編碼)、Encoding.ASCII(獲取 7 位 ASCII 字符集的編碼)、Encoding.Unicode(獲取採用 Little-Endian 位元組順序的 Unicode 格式的編碼)、Encoding.UTF7(獲取 UTF-7 格式的編碼)、Encoding.UTF8(獲取 UTF-8 格式的編碼) 等。這裡主要說說 Encoding.Default 和 Encoding.Unicode 用於轉換的區別。
  在字串轉換到位元組陣列的過程中,Encoding.Default 會將每個單位元組字元,如半形英文,轉換成 1 個位元組,而把每個雙位元組字元,如漢字,轉換成 2 個位元組。而 Encoding.Unicode 則會將它們都轉換成兩個位元組。我們可以透過下列簡單的瞭解一下轉換的方法,以及使用 Encoding.Default 和 Encodeing.Unicode 的區別:

private void TestStringBytes() {
    string s = "C#語言";
    byte[] b1 = System.Text.Encoding.Default.GetBytes(s);
    byte[] b2 = System.Text.Encoding.Unicode.GetBytes(s);
    string t1 = "", t2 = "";
    foreach (byte b in b1) {
        t1 += b.ToString("") + " ";
    }
    foreach (byte b in b2) {
        t2 += b.ToString("") + " ";
    }
    this.textBox1.Text = "";
    this.textBox1.AppendText("b1.Length = " + b1.Length + "n");
    this.textBox1.AppendText(t1 + "n");
    this.textBox1.AppendText("b2.Length = " + b2.Length + "n");
    this.textBox1.AppendText(t2 + "n");
}

  執行結果如下,不說詳述,相信大家已經明白了。

b1.Length = 6
67 35 211 239 209 212
b2.Length = 8
67 0 35 0 237 139 0 138

  將位元組陣列轉換成字串,使用 Encoding 類的 string GetString(byte[]) 或 string GetString(byte[], int, int) 方法,具體使用何種 Encoding 還是由編碼決定。在 TestStringBytes() 函式中新增如下語句作為例項:

byte[] bs = {97, 98, 99, 100, 101, 102};
string ss = System.Text.Encoding.ASCII.GetString(bs);
this.textBox1.AppendText("The string is: " + ss + "n");

  執行結果為:The string is: abcdef

7. 各種數值型別和位元組陣列之間的轉換

  在第 1 條中我們可以查到各種數值型需要使用多少位元組的空間來儲存資料。將某種數值型別的資料轉換成位元組陣列的時候,得到的一定是相應大小的位元組陣列;同樣,需要把位元組陣列轉換成數值型別,也需要這個位元組陣列大於相應數值型別的位元組數。
  現在介紹此類轉換的主角:System.BitConverter。該類提供了 byte[] GetBytes(...) 方法將各種數值型別轉換成位元組陣列,也提供了 ToInt32、ToInt16、ToInt64、ToUInt32、ToSignle、ToBoolean 等方法將位元組陣列轉換成相應的數值型別。

  由於這類轉換通常只是在需要進行較細微的編碼/解碼操作時才會用到,所以這裡就不詳細敘述了,僅把 System.BitConverter 類介紹給大家。

8. 轉換成十六進位制

  任何資料在計算機內部都是以二進位制儲存的,所以進位制與資料的儲存無關,只與輸入輸出有關。所以,對於進位制轉換,我們只關心字串中的結果。
  在上面的第 4 條中提到了 ToString() 方法可以將數值轉換成字串,不過在字串中,結果是以十進位制顯示的。現在我們帶給它加一些引數,就可以將其轉換成十六進位制——使用 ToString(string) 方法。
  這裡需要一個 string 型別的引數,這就是格式說明符。十六進位制的格式說明符是 "x" 或者 "X",使用這兩種格式說明符的區別主要在於 A-F 六個數字:"x" 代表 a-f 使用小寫字母表示,而 "X" 而表示 A-F 使用大字字母表示。如下例:

private void TestHex() {
    int a = 188;
    this.textBox1.Text = "";
    this.textBox1.AppendText("a(10) = " + a.ToString() + "n");
    this.textBox1.AppendText("a(16) = " + a.ToString("x") + "n");
    this.textBox1.AppendText("a(16) = " + a.ToString("X") + "n");
}

  執行結果如下:

a(10) = 188
a(16) = bc
a(16) = BC

  這時候,我們可能有另一種需求,即為了顯示結果的整齊,我們需要控制十六進位制表示的長度,如果長度不夠,用前導的 0 填補。解決這個問題,我們只需要在格式說明符“x”或者“X”後寫上表示長度的數字就行了。比如,要限制在 4 個字元的長度,可以寫成“X4”。在上例中追加一句:

this.textBox1.AppendText("a(16) = " + a.ToString("X4") + "n");

  其結果將輸出 a(16) = 00BC。
  現在,我們還要說一說如何將一個表示十六進位制數的字串轉換成整型。這一轉換,同樣需要藉助於 Parse() 方法。這裡,我需要 Parse(string, System.Globalization.NumberStyles) 方法。第一個引數是表示十六進位制數的字串,如“AB”、“20”(表示十進位制的 32) 等。第二個引數 System.Globalization.NumberStyles 是一個列舉型別,用來表示十六進位制的列舉值是 HexNumber。因此,如果我們要將“AB”轉換成整型,就應該這樣寫:int b = int.Parse("AB", System.Globalization.NumberStyles.HexNumber),最後得到的 b 的值是 171。

9. 日期型資料和長整型資料之間的轉換

  為什麼要將日期型資料轉換為長整型資料呢?原因很多,但就我個人來說,經常將它用於資料庫的日期儲存。由於各種資料庫對日期型的定義和處理是不一樣的,各種語言對日期型資料的定義的處理也各不相同,因為,我寧願將日期型資料轉換成長整型再儲存到資料庫中。雖然也可以使用字串來儲存,但使用字串也會涉及到許多問題,如區域等問題,而且,它需要比儲存長整型資料更多的空間。
  日期型資料,在 C# 中的參與運算的時候,應該也是轉換為長整型資料來運算的。它的長整型值是自 0001 年 1 月 1 日午夜 12:00 以來所經過時間以 100 毫微秒為間隔表示時的數字。這個數在 C# 的 DateTime 中被稱為 Ticks(刻度)。DateTime 型別有一個名為 Ticks 的長整型只讀屬性,就儲存著這個值。如此,要從一個 DataTime 型資料得到 long 型值就非常簡單了,只需要讀出 DataTime 物件的 Ticks 值即可,如:

long longDate = DateTime.Now.Ticks;

  DateTime 的建構函式中也提供了相應的,從長整型資料構造 DateTime 型資料的函式:DateTime(long)。如:

DateTime theDate = new DateTime(longDate);

  但這樣對於很多 VB6 程式設計師來說,是給他們出了一道難題,因為 VB6 中的日期型資料內部是以 Double 型表示的,將其轉換為長整型後得到的僅僅是日期,而沒有時間。如何協調這兩種日期型別呢?
System.DateTime 提供了 double ToOADate() 和 static DateTime FromOADate(double) 兩個函式來解決這個問題。前者將當前物件按原來的 double 值輸出,後者則從一個 double 值獲得一個 System.DateTime 物件。舉例如下:

private void TestDateTimeLong() {
    double doubleDate = DateTime.Now.ToOADate();
    DateTime theDate = DateTime.FromOADate(doubleDate);
    this.textBox1.Text = "";
    this.textBox1.AppendText("Double value of now: " + doubleDate.ToString() + "n");
    this.textBox1.AppendText("DateTime from double value: " + theDate.ToString() + "n");
}

  執行結果:

Double value of now: 37494.661541713
DateTime from double value: 2002-8-26 15:52:37

10. 格式化日期型資料

  程式設計的過程中,通常需要將日期型資料按照一定的格式輸出,當然,輸出結果肯定是字串。為此,我們需要使用 System.DateTime 類的 ToString() 方法,併為其指定格式字串。
  MSDN 中,System.Globalization.DateTimeFormatInfo 類的概述裡對模式字串有非常詳細的說明,因此,這裡我只對常用的一些格式進行說明,首先請看下錶:

d

月中的某一天

一位數的日期沒有前導零

dd

月中的某一天

一位數的日期有一個前導零

ddd

週中某天的縮寫名稱

AbbreviatedDayNames 中定義

dddd

週中某天的完整名稱

DayNames 中定義

M

月份數字

一位數的月份沒有前導零

MM

月份數字

一位數的月份有一個前導零

MMM

月份的縮寫名稱

AbbreviatedMonthNames 中定義

MMMM

月份的完整名稱

MonthNames 中定義

y

不包含紀元的年份

如果不包含紀元的年份小於 10,則顯示不具有前導零的年份

yy

不包含紀元的年份

如果不包含紀元的年份小於 10,則顯示具有前導零的年份

yyyy

包括紀元的四位數的年份

h

12 小時制的小時

一位數的小時數沒有前導零

hh

12 小時制的小時

一位數的小時數有前導零

H

24 小時制的小時

一位數的小時數沒有前導零

HH

24 小時制的小時

一位數的小時數有前導零

m

分鐘

一位數的分鐘數沒有前導零

mm

分鐘

一位數的分鐘數有一個前導零

s

一位數的秒數沒有前導零

ss

一位數的秒數有一個前導零

  為了便於大家的理解,不妨試試下面的程式:

private void TestDateTimeToString() {
    DateTime now = DateTime.Now;
    string format;
    this.textBox1.Text = "";
    format = "yyyy-MM-dd HH:mm:ss";
    this.textBox1.AppendText(format + ": " + now.ToString(format) + "n");
    format = "yy年M日d日";
    this.textBox1.AppendText(format + ": " + now.ToString(format) + "n");
}

  這段程式將輸出結果:

yyyy-MM-dd HH:mm:ss: 2002-08-26 17:03:04
yy年M日d日: 02年8日26日

  這時候,又出現一個問題,如果要輸出的文字資訊中包含格式字元怎麼辦?如

format = "year: yyyy, month: MM, day: dd";
this.textBox1.AppendText(now.ToString(format) + "n");

  將輸出:

2ear: 2002, 4on下5: 08, 26a2: 26

  這並不是我想要的結果,怎麼辦呢?有辦法——

format = ""year": yyyy, 'month': MM, 'day': dd";
this.textBox1.AppendText(now.ToString(format) + "n");

  看,這次執行結果對了:

year: 2002, month: 08, day: 26

  可以看出,只需要使用單引號或者雙引號將文字資訊括起來就好。
  如果文字資訊中包含雙引號或者單引號又怎麼辦呢?這個問題,請讀者們動動腦筋吧!

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/82387/viewspace-903665/,如需轉載,請註明出處,否則將追究法律責任。

相關文章