資料庫中varchar和Nvarchar區別與聯絡

衣舞晨風發表於2015-05-13
        在資料庫中新建表的時候發現了欄位型別有的帶n有的不帶n,那麼兩者之間有什麼區別?
        於是上網查詢一些資料如下:
一、
1、CHAR。CHAR儲存定長資料很方便,CHAR欄位上的索引效率級高,比如定義char(10),那麼不論你儲存的資料是否達到了10個位元組,都要佔去10個位元組的空間,不足的自動用空格填充,所以在讀取的時候可能要多次用到trim()。

2、VARCHAR。儲存變長資料,但儲存效率沒有CHAR高。如果一個欄位可能的值是不固定長度的,我們只知道它不可能超過10個字元,把它定義為 VARCHAR(10)是最合算的。VARCHAR型別的實際長度是它的值的實際長度+1。為什麼“+1”呢?這一個位元組用於儲存實際使用了多大的長度。從空間上考慮,用varchar合適;從效率上考慮,用char合適,關鍵是根據實際情況找到權衡點。

3、TEXT。text儲存可變長度的非Unicode資料,最大長度為2^31-1(2,147,483,647)個字元。

4、NCHAR、NVARCHAR、NTEXT。這三種從名字上看比前面三種多了個“N”。它表示儲存的是Unicode資料型別的字元。我們知道字元中,英文字元只需要一個位元組儲存就足夠了,但漢字眾多,需要兩個位元組儲存,英文與漢字同時存在時容易造成混亂,Unicode字符集就是為了解決字符集這種不相容的問題而產生的,它所有的字元都用兩個位元組表示,即英文字元也是用兩個位元組表示。nchar、nvarchar的長度是在1到4000之間。和char、varchar比較起來,nchar、nvarchar則最多儲存4000個字元,不論是英文還是漢字;而char、varchar最多能儲存8000個英文,4000個漢字。可以看出使用nchar、nvarchar資料型別時不用擔心輸入的字元是英文還是漢字,較為方便,但在儲存英文時數量上有些損失。


所以一般來說,如果含有中文字元,用nchar/nvarchar,如果純英文和數字,用char/varchar

它們的區別概括成:
CHAR,NCHAR 定長,速度快,佔空間大,需處理
VARCHAR,NVARCHAR,TEXT 不定長,空間小,速度慢,無需處理

NCHAR、NVARCHAR、NTEXT處理Unicode碼

參考文章:點選開啟連結

二、
        varchar在SQL Server中是採用單位元組來儲存資料的,nvarchar是使用Unico來儲存資料的.中文字元儲存到SQL Server中會儲存為兩個位元組(一般採用Unico編碼),英文字元儲存到資料庫中,如果欄位的型別為varchar,則只會佔用一個位元組,而如果欄位的型別為nvarchar,則會佔用兩個位元組. 
        正常情況下,我們使用varchar也可以儲存中文字元,但是如果遇到作業系統是英文作業系統並且對中文字型的支援不全面時, 在SQL Server儲存中文字元為varchar就會出現亂碼(顯示為??).而且正常情況下,主機都會支援中文的環境,所以如果使用varchar來儲存資料,在開發階段是發現不了的.多數情況下,在佈署的時候也不會有問題.

        但是如果佈署的主機是英文作業系統,並且不支援中文環境,那問題就出來了.所有的varchar欄位在儲存中文的時候都會變成亂碼(顯示為??).而且一般情況下你不會知道這是因為你採用了錯誤的資料型別來儲存所造成的,你會試著去裝中文字型,試著去設定作業系統的語言環境...這些都不能解決問題,唯一能解決問題的是把資料庫欄位的型別個性為nvarchar(或者nchar).對專案管理比較熟悉的朋友應該都知道,到佈署階段再來修改資料庫是一個很恐怖的事情.

  使用nvarchar的另一個非常好處就是在判斷字串的時候可以不需要考慮中英文兩種字元的差別.
  當然,使用nvarchar儲存英文字元會增大一倍的儲存空間.但是在儲存代價已經很低廉的情況下,優先考慮相容性會給你帶來更多好處的.

  所以在Design的時候應該儘量使用nvarchar來儲存資料.只有在你確保該欄位不會儲存中文的時候,才採用varchar來儲存. 


       一般來說,如果含有中文字元,用nchar/nvarchar,如果純英文和數字,用char/varchar

參考文章:點選開啟連結


        Unicode字符集就是為了解決字符集這種不相容的問題而產生的,它所有的字元都用兩個位元組表示,即英文字元也是用兩個位元組表示。

相關文章