轉chinaunix一儲存大牛 about device storage

wisdomone1發表於2008-05-22
內容:儲存和相關基礎知識
範圍:限opensystem和windows
版本:Version 0.1 build 20060904

說在前面的幾句話:
我工作的時間也不短了,但是還算是一個老菜鳥,所以我姑妄說之,您姑妄聽之.另外,我也是想到哪兒寫道哪兒,沒什麼章法,還望海涵.

有些新手總是在各式各樣的概念裡繞來繞去,弄的不亦樂乎。所以我就把我的一些理解寫了下來,供您參考.我說的不侷限於任何一種具體產品和廠家,也可能有些說法和某些廠家的說法不一樣,但是我覺得應該算的上是本原的東西,有以不變應萬變之功效,呵呵,見笑
1、關於HBA
HBA的全稱為Host Bus Adapter,即主機匯流排介面卡。
a、匯流排介面卡是個什麼東西呢?
我們首先要了解一下主機的結構,一臺計算機內部多半由兩條匯流排串在起來(當然實際情況會有不同,這裡只討論常見的,簡單的情況),一條匯流排叫系統匯流排,一條叫I/O匯流排。系統匯流排上接了CPU,MEmory,cache什麼的,I/O匯流排上接的就是外圍裝置,現如今最常見的就是PCI匯流排了。這兩條匯流排之間用橋接的晶片或者說電路連線起來。舉個形象的例子,就好比一個城市裡,有兩條主幹道,一條屬於行政區,一條屬於商業區,中間有個環島,將兩條主幹道連線到了一起,系統匯流排就好比行政區裡的主幹道,而I/O匯流排就好比商業區的主幹道。系統匯流排和I/O匯流排的頻寬的單位都是以Gbyte來記,但是顯而易見的是,行政區的主幹道和商業區的主幹道相比的話,前者肯定更“核心”,更寬,更順暢,設計的要求也高。
我們知道,在向公僕部門要求服務的時候,是要有一些介面的部門和程式的,而橋接晶片的作用就是連線和協調兩條匯流排的工作的。
雖然I/O匯流排的速度和系統匯流排的頻寬相比要低很多,但是好歹也是以G來計量的,而我們知道外圍裝置的速度,往往只有幾百兆,甚至幾十k而已,怎麼協調工作呢?好比賣煎餅果子攤子不能直接戳到城市主幹道上,怎麼辦?好辦,在主幹道邊上開個2000平米的小吃城,把攤子都收進去好了。那麼主機匯流排介面卡的作用也就是這個,我們就是要把外設組織起來,連線到I/O匯流排上去!HBA就是指Host和I/O BUS直接的一個介面卡,也好比一個水管工常說的“雙通”。
b、常見的HBA有哪些呢?
比如顯示卡,網路卡,scsi卡,1394卡等等。我要拿出來說的就是FCHBA和ATA&IDE。我們通常說的什麼Emulex的LP9002,什麼Qlogic的QLA2340都是FCHBA卡,就是將Fibre Channel的裝置和IO匯流排連線起來的介面卡。ATA也是一種介面卡技術,我們PC主機板上的ATA介面,就是一個磁碟介面卡的對外介面,要強調的就是,ATA說的是介面卡技術,IDE是說得儲存外設技術,比如我們可以說IDE硬碟,IDE光碟機,說ATA介面,但是說IDE介面,ATA硬碟就不時那麼合適了,雖然很多情況下,大家都習慣把他們混在一起說。
描述HBA的時候,有幾個主要的規範要說一下
  > 一個承上,就是說,HBA和IOBUS怎麼連,我們經常說的PCI介面卡,就是指這個HBA卡是要插在PCI BUS上的PCI slot上的,但是現在的計算機上,不僅僅只有PCI匯流排而已,大家碰到的時候留意。
  >一個啟下,就是說HBA要和外設怎麼連,這樣的規範就很多了。
  >再說HBA本身,比如頻寬,比如執行機制(protocol等),獨立處理能力等等
Tips:有時候我們看到的一塊卡,看到的實際是一個物理的卡,有的時候實際上是多個Adapter,好比一家機構,掛多個牌子,有的時候,一塊卡有兩條通道,好比一家公司,有兩套人馬。

2、關於lun

a、lun的概念
   lun的全稱是logical unit number,也就是邏輯單元號。我們知道scsi匯流排上可掛接的裝置數量是有限的,一般為6個或者15個,我們可以用target ID(也有稱為scsi id的)來描述這些裝置,裝置只要一加入系統,就有一個代號,我們在區別裝置的時候,只要說幾號幾號就ok了。
   而實際上我們需要用來描述的物件,是遠遠超過該數字的,於是我們引進了lun的概念,也就是說lun id的作用就是擴充了target id。每個target下都可以有多個lun device,我們通常簡稱lun device為lun,這樣就可以說每個裝置的描述就有原來的target x變成target x lun y了,那麼顯而易見的,我們描述裝置的能力增強了.就好比,以前你給別人郵寄東西,寫地址的時候,可以寫:
   xx市人民大街54號 xxx(收)
   但是自從高樓大廈越來越多,你不得不這麼寫:
   xx市人民大街54號xx大廈518室 xxx (收)
   所以我們可以總結一下,lun就是我們為了使用和描述更多裝置及物件而引進的一個方法而已,一點也沒什麼特別的地方.
b、lun是什麼東西?
   lun id不等於某個裝置,只是個號碼而已,不代表任何實體屬性,在我們的實際環境裡,我們碰到的lun可能是磁碟空間,可能是磁帶機,或者是media changer等等.
   lun的神秘之處(相對於一些新手來說)在於,它很多時候不是什麼可見的實體,而是一些虛擬的物件。比如一個陣列櫃,主機那邊看作是一個target device,那為了某些特殊需要,我們要將磁碟陣列櫃的磁碟空間劃分成若干個小的單元給主機來用,於是就產生了一些什麼邏輯驅動器的說法,也就是比target device級別更低的邏輯物件,我們習慣於把這些更小的磁碟資源稱之為lun0,lun1,lun2....什麼的。而作業系統的機制使然,作業系統識別的最小儲存物件級別就是lun device,這是一個邏輯物件,所以很多時候被稱之為logical device。
   有人說,我的windows裡,就認到一個磁碟呀,沒看到什麼lun的說法,是不是lun=physical disk呢?回答是否定的,只要你注意,磁碟的屬性裡就可以看到有一個lun的值,只是因為你的disk沒有被劃分為多個儲存資源物件,而將整個磁碟當作一個lun來用,lun id預設為零,如此而已。
   我們曾經碰到過這樣的問題,比如有人問,我們有一個磁碟陣列,連到了兩個主機上,我們劃分了一個lun給兩個主機認到,然後我們想,先在作業系統將磁碟分為兩個區,讓兩個主機分別使用兩個分割槽,然後再出現某一臺主機當機之後,使用叢集軟體將該分割槽切換到另外一個主機上去,這樣可行嗎?答案也是否定的,叢集軟體操作的磁碟單元是lun,而不是分割槽,所以該操作是不可行的。當然,在一些環境,一般也是一些要求比較低的環境,可以在多個主機上掛載不同的磁碟分割槽,但是這種情況下,實際上是沒有涉及到磁碟的切換的,所以在一些高要求的環境裡,這種情況根本就不允許存在。
   還要說明的地方是,在有些廠商和有些產品的概念裡,lun id被繫結到了具體的device上,比如ibm的一些帶庫,整個帶庫只有一個target id,然後changer,tape drive被分別分配為lun0,lun1,lun2.....,但是我們要注意到,這只是產品做了特別設計,也是少數情況。
c、儲存和主機的電氣獨立時代的lun的概念
還有很多新手總是把陣列裡面的磁碟和主機的內部磁碟的一些概念搞混淆了。
在磁碟陣列和磁帶庫大行其道的時代,儲存越來越智慧化,越來越像一個獨立的機器,實際上儲存和主機的電氣獨立本來就是一個必然趨勢,俗話說得好,兒大要分家嘛。在儲存越來越重要的時代,儲存要自立門戶是必然的事。
如果我們把儲存當作一個獨立的主機來看,理解起來就很簡單了。我們說到lun的概念的時候,我們就要將分為兩個層面。一個層面就是在陣列這個機器的os識別到的範圍,一個層面就是伺服器的os識別到的範圍。這兩個層面是相對獨立的,因為如果我們把儲存當作一個主機來看,那麼它自然有自己的device,target,lun之說,而伺服器也有自己的device,target,lun之說;另外一方面,這兩個層面又是相互關聯的,一個陣列的控制系統,大多都有虛擬化的功能,陣列想讓主機看到什麼樣的東西,主機才能看到相應的東西。當然,伺服器識別到的最小的儲存資源,就是lun級別的。那麼主機的HBA卡看到的儲存上的儲存資源就靠主要兩個東西來定位,一個就是儲存系統的控制器(target),一個就是lun id,這個lun是由儲存的控制系統給定的,是儲存系統的某部分儲存資源。
d、lun masking,lun mapping
我們有了獨立的磁碟陣列用了之後,伺服器只要看到儲存的控制系統,就有可能使用磁碟陣列的磁碟資源,但是磁碟陣列不可能只為某一個伺服器來使用,所以他必須管制主機使用某部分磁碟資源。這個管制分為兩個部分:一部分就是lun mapping,類似於綠色通道,就是保證伺服器能看到某部分儲存資源,一部分就是lun masking,類似於警戒線,就是保證伺服器只可訪問給它分配的儲存資源,而沒分配給伺服器的資源,就不要染指了。
實現lun masking和lun mapping有三種方法:一個是基於儲存控制系統來設定,一個是基於儲存交換系統來設定,一個是基於伺服器os來設定。
基於儲存控制系統得設定,是比較常見的設定,比如很多磁碟陣列的控制系統,本身就能設定lun被某伺服器看到。比如FastT的partition功能。
基於儲存交換系統的設定,也是一種常用的方法,比如常說的zoning。
基於伺服器os的設定,比較少採用,一般採用安裝某些作業系統上安裝某些軟體來實現,因為這個方法全靠伺服器自覺,所以比較少用,呵呵。
e、lun的multi-path
現在,儲存網路越來越發達了,一個lun有多條通路可以訪問也不是新鮮事了。
伺服器使用多個HBA連線到儲存網路,儲存網路又可能是由多個交換裝置組成,而儲存系統又可能有多個控制器和鏈路,lun到伺服器的儲存網路鏈路又可能存在著多條不同的邏輯鏈路。那麼,必然的,同一個physical lun在伺服器上必然被識別為多個裝置。因為os區別裝置無非用的是匯流排,target id,lun id來,只要號碼不同,就認為是不同的裝置。
由於上面的情況,多路徑管理軟體應運而生了,比如emc的powerpath,這個軟體的作用就是讓作業系統知道那些作業系統識別到lun實際上是一個真正的physical lun,具體的做法,就是生成一個特別的裝置檔案,作業系統操作這個特殊的裝置檔案。而我們知道,裝置檔案+driver+firmware的一個作用,就是告訴作業系統該怎麼使用這個裝置。那麼就是說,多路徑管理軟體從driver和裝置檔案著手,告訴了作業系統怎麼來處理這些身份複雜的lun。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/9240380/viewspace-350570/,如需轉載,請註明出處,否則將追究法律責任。

相關文章