Java I/O系統學習系列二:輸入和輸出

木瓜芒果發表於2019-06-10

  程式語言的I/O類庫中常使用流這個抽象概念,它代表任何有能力產出資料的資料來源物件或者是有能力接收資料的接收端物件。“流”遮蔽了實際的I/O裝置中處理資料的細節。

  在這個系列的第一篇文章:<<Java I/O系統學習系列一:File和RandomAccessFile>>中,我們講到RandomAccessFile可以寫入和讀取檔案,具備I/O功能,但是其只能針對檔案,而I/O還涉及到很多其他場景比如網路、讀取記憶體中的字串等,所以Java類庫中提供了一系列的類庫來對其進行支援,也就是本文要總結學習的。

  Java類庫中的I/O類分成輸入和輸出兩部分,可以在JDK文件裡的類層次結構中檢視到。通過繼承,任何自Inputstream或Reader派生而來的類都含有名為read()的基本方法,用於讀取單個位元組或者位元組陣列。同樣,任何自OutputStream或Writer派生而來的類都含有名為write()的基本方法,用於寫單個位元組或者位元組陣列。但是,我們通常不會用到這些方法,它們之所以存在是因為別的類可以使用它們,以便提供更有用的介面。因此,我們很少使用單一的類來建立流物件,而是通過疊合多個物件來提供所期望的功能(這是裝飾器設計模式的應用,也有專門寫文總結過:裝飾器模式)。實際上,Java中“流”類庫讓人迷惑的主要原因就在於:建立單一的結果流,卻需要建立多個物件。

  I/O需要應對的場景往往是多樣化的,Java類庫的設計者則是通過建立大量的類來解決這個難題,區區一篇文章難以詳述,本文也只是盡力對傳統I/O類庫所涉及到的類提供一個總覽,在把握整個脈絡的前提下才能更好的理解並應用I/O類庫來解決實際程式設計問題。如需涉及到細節,還是需要參考JDK文件。

  輸入輸出主要是字元流和位元組流,本文主要從如下幾個方面總結:

  InputStream/OutputStream

  Reader/Writer

  總結

 

 

1. InputStream/OutputStream

  Java 1.0中,類庫的設計者首先限定與輸入有關的所有類都應該從InputStream繼承,而與輸出有關的所有類都應該從OutputStream繼承。

1.1 InputStream

  InputStream的作用是用來表示那些從不同資料來源產生輸入的類。這些資料來源包括:

  • 位元組陣列;
  • String物件;
  • 檔案;
  • “管道”,工作方式與實際管道相似,即從一端輸入,從另一端輸出;
  • 一個由其他種類的流組成的序列,以便我們可以將它們收集合併到一個流內;
  • 其他資料來源,如Internet連線等;

   每一種資料來源都有相應的InputStream子類,作為基礎構件:

  • ByteArrayInputStream,允許將記憶體的緩衝區當作InputStream使用;
  • StringBufferInputStream,將String轉換成InputStream;
  • FileInputStream,用於從檔案中讀取資訊;
  • PipedInputStream,產生用於寫入相關PipedOutputStream的資料。實現“管道化”概念;
  • SequenceInputStream,將兩個或多個InputStream物件轉換成單一InputStream;

1.2 OutputStream

  OutputStream的作用是表示那些可以輸出到不同資料來源的類,其具體的子類決定了輸出所要去往的目標:位元組陣列、檔案或管道,同樣是作為基礎構件:

  • ByteArrayOutputStream,在記憶體中建立緩衝區。所有送往“流”的資料都要放置在此緩衝區;
  • FileOutputStream,用於將資訊寫至檔案;
  • PipedOutputStream,任何寫入其中的資訊都會自動作為相關PipedInputStream的輸出,實現“管道化”概念;

1.3 裝飾器

  除了有上面的基礎構件,還有兩個子類:FilterInputStream/FilterOutputStream,也是InputStream和OutputStream的子類,它們為“裝飾器”(decorator)類提供基類,其中,“裝飾器”類可以把屬性或有用的介面與基礎構件連線在一起。因為上面提到的InputStream/OutputStream是單位元組為單位來操作的,而真實的I/O場景遠不止於此,所以就通過“裝飾”(其原理是類之間的組合)的方式來擴充套件其功能。

  我自己梳理了一下InputStream/OutputStream流繼承層次結構,結合下面的解釋來看可以對位元組流體系有一個更清晰的認識:

1.3.1 FilterInputStream

  FilterInputStream類主要有如下子類,也就是具體裝飾器:

  • DataInputStream;
  • BufferedInputStream;
  • LineNumberInputStream;

  其提供的裝飾功能主要在兩個方面:

  • 讀取不同的基本型別資料以及String物件,比如DataInputStream;

  • 在內部修改InputStream的行為方式:是否緩衝、是否保留它所讀過的行,如BuffereInputStream、LineNumberInputStream;

1.3.2 FilterOutputStream

  與FilterInputStream類似,FilterOutputStream主要是完成寫入的功能,主要有如下裝飾器:

  • DataOutputStream,與DataInputStream搭配使用,因此可以按照可移植方式向流中寫入基本型別資料(int、char、long);
  • PrintStream,用於產生格式化輸出。其中DataOutputStream處理資料的儲存,PrintStream處理顯示;
  • BufferedOutputStream,使用它以避免每次傳送資料時都要進行實際的寫操作。代表“使用緩衝區”。可以呼叫flush()清空緩衝區;

   

2. Writer/Reader

  InputStream和OutputStream是提供面向位元組形式的I/O,但是InputStream/OutputStream流繼承層次結構僅支援8位位元組流,並且不能很好地處理16位的Unicode字元。由於Unicode用於字元國際化(Java本身的char也是16位的Unicode),所以新增Reader/Writer繼承層次結構就是為了在所有的I/O操作中都支援Unicode。

  幾乎所有原始的Java I/O流類都有相應的Reader和Writer類來提供天然的Unicode操作,我們可以對比一下:

  我們發現大體上,這兩個不同的繼承層次結構中的介面即使不能完全相同,但是也是非常相似的。

  對於InputStream和OutputStream來說,我們會使用FilterInputStream和FilterOutputStream的裝飾器子類來修改“流”以滿足特殊需要。Reader/Writer的類繼承層次結構繼續沿用相同的思想,但是又並不完全採用上面說到的裝飾器模式。如下是自己梳理的Reader/Writer繼承層次結構:

  與前面的I/O繼承層次結構圖相對比可以發現,儘管BufferedOutputStream是FilterOutputStream的子類,但是BufferedWriter並不是FilterWriter的子類(FilterWriter是抽象類,但是沒有任何子類,僅僅是作為一個佔位符)。

2.1 介面卡

  有時我們必須把來自於“位元組”層次結構中的類和“字元”層次結構中的類結合起來使用。為了實現這個目的,要用到“介面卡”(adapter)類:InputStreamReader可以把InputStream轉換為Reader,而OutputStreamWriter可以把OutputStream轉換為Writer。

  

3. 總結

  • I/O需要應對的場景往往是多樣化的,Java類庫的設計者通過建立大量的類來解決這個難題,在實際使用中,通過裝飾器模式避免“類爆炸”,但類的數量還是不少,這也是Java中“流”類庫讓人迷惑的主要原因;
  • InputStream和OutputStream是提供面向位元組形式的I/O,而Reader和Writer則提供相容Unicode與面向字元的IO功能;
  • 如果需要把位元組流和字元流結合起來使用,可以使用介面卡進行轉換,InputStreamReader可以把InputStream轉換為Reader,而OutputStreamWriter可以把OutputStream轉換為Writer;

   本文主要是梳理了傳統I/O流的類繼承層次結構,包括位元組流(InputStream/OutputStream)和字元流(Writer/Reader),並沒有一開始就一頭扎進I/O類庫的海洋中,主要是希望通過這種方式能夠對整個I/O體系有一個清晰的認識,這對於進一步的學習可以有更明確的指導作用,下文會針對一些I/O的的典型使用方式進行總結。

相關文章