我們生活在一個資訊爆炸的時代,據 IDC 預測 2020 年全球產生資料量將超過 40ZB,相當於地球上每個人每年將產生 5200GB 的資料。
資料科普:儲存單位換算表1 B(Byte 位元組)= 8 bit
1 KB = 1024 B
1 MB = 1024 KB
1 GB = 1024 MB
1 TB = 1024 GB
1 PB = 1024 TB
1 EB = 1024 PB
1 ZB = 1024 EB = 1.0 × 1021 B
如何穩定地儲存這大量的資料,已經成為了一個難題。這個難題背後,儲存行業一直默默的支撐科技網路的發展,與我們的生活息息相關。
從最早應用於儲存紡織行業圖案的打孔紙卡,到後來用於調查人口時的資訊儲存,儲存介質在歷史的長河中也是不斷的更迭演變。
唱片、磁帶、碟片的誕生,音樂和影視行業進入了大家的視野,風靡一時;半導體、硬碟、快閃記憶體等的出現,推進了資訊時代的發展進步。
資料儲存默默的支撐著我們人類社會的進步發展,今天,就讓我們來了解一下資料儲存的發展歷史。
第 0 章 什麼是儲存器
儲存器,是電子裝置中用來儲存資訊的「記憶」裝置。
它具備儲存資料和資訊的能力,並且可以連續執行程式,進行廣泛的資訊處理。
在數字系統中,只要可以儲存二進位制資料的都可以稱為儲存器;在積體電路中,具有儲存功能的電子元器件也成為儲存器(如RAM、FIFO);在系統中,具有實物形式的儲存裝置也叫儲存器,如記憶體條、記憶體卡等。
在計算機中的儲存器包含內部儲存器(記憶體)和外部儲存器。
其中,記憶體由二部分組成:
Random-access memory (RAM) :隨機存取儲存器
Read-Only Memory(ROM):只讀儲存器
對於 CPU 來說,RAM 是主要存放資料和程式的地方,所以也叫做「主存」,也就是我們平常說的「記憶體條」,一旦斷電資料就丟失了。
ROM 對於使用者來說,只能讀取資料不能寫入資訊,斷電也沒有關係,放 ROM 的資料一輩子都不會變,但不能進行修改調整。
外部儲存器和記憶體有點不同,我們可以對「儲存器」中的資料進行讀取和寫入,外部儲存器中的資料會一直存在,直到被覆蓋或刪除,斷電也不會丟失。
比如 U 盤就是一種很常見的外部儲存器,能低成本+可靠+長時間儲存上 GB 的資料,但在使用這種儲存介質前,這麼點兒的體積儲存這麼多資料,想都不敢想啊。
第 1 章 最早的儲存介質 - 打孔紙卡
名詞解析:打孔紙卡打孔紙卡又稱穿孔卡、霍爾瑞斯式卡或 IBM 卡,是一塊紙板,在預先知道的位置利用打洞與不打洞來表示數字訊息。早期的數字電腦運用打孔機已輸入資訊的打孔卡當做計算機程式和資料的主要輸入介質。
1801 年,法國人約瑟夫·瑪麗·雅卡爾發明了打孔卡,當時用在控制織布機織出的圖案。
1880 年代,美國人口調查局職員赫爾曼·何樂禮發明了用於人口普查資料的穿孔卡片及打孔卡片製表機,並於 1888 年申請了第一個專利權。
在 1890 年美國人口普查中,通過打孔製片和打孔機,僅 6 周就完成了統計。而此前 1880 年美國人口普查的資料全靠手工處理,歷時 7 年才得出最終結果。
據說使用打孔卡紙打指令時,需要用一個特製的鋼夾子把紙帶夾住,夾子上有八個孔。根據預先約定的位置,用一個鋼頂針在給定的孔位把計算機一條指令在紙帶上鑽成幾個孔,有點像修鞋師傅給皮帶打孔。
一個程式少說也有幾百上千條指令,穿在紙帶上後紙帶足有好幾米長,沒有個三五天是穿不完的。
順便提一下,何樂禮發明的打孔卡片製表機,是電腦的前身;他當時建立的製表公司,是今天 IBM 的前身。
20 世紀期間,打孔卡應用在單位記錄機作為輸入端、處理和計算機程式。到1940年代,紙卡標準是 80列x12行,一張卡能存 960 位資料 (80x12=960)。
據我們所知的最大紙卡程式是美國軍方的「半自動地面防空系統」 簡稱 SAGE,一個在 1958 年投入使用的防空系統,主程式儲存在 62,500 個紙卡上,大小 5MB 左右。
但其實打孔紙卡我們每個人幾乎都用過,只不過是革新之後的形式 —— 答題卡。
答題卡是威廉 · 桑德斯(William E. Sanders)發明的,目的是為了增加考試閱卷效率。
和打孔紙卡有些類似,當時的學生需要用打孔器在答題卡上戳洞。閱卷時,每一個答案的選項位置,都會有一個金屬棒對應。如果答案是正確的,金屬幫就會從答題紙的孔穿下去。如果答案錯誤,金屬棒就穿不下去。最終根據答題紙的稱量結果換算出得分。
後來,邁克爾 · 索科爾斯基(Michael Sokolski)利用石墨的不透明性對答題卡進行了革新,也就出現了我們沿用至今的石墨答題卡(又稱資訊卡)。
在答題卡上,使用石墨填塗對應位置,然後用一束光掃描答題卡,因為石墨的特性是隻會吸收和反射光線,而不會讓光線透過它,被塗寫的部分就會向外反射出光線。在反射出的方向上有捕捉光線的感測器,答卷資料就會被系統獲取並計算出得分。
除了作為答題卡很實用,打孔卡紙作為儲存介質,因為不用電而且便宜耐用,被持續使用了十多年。但它的缺點也很明顯,就是讀取慢,並且只能寫入一次,打的孔無法輕易補上,對於存臨時值,紙卡不好用,所以大家開始尋找更快更大更靈活的儲存方式。
第 2 章 儲存介質的發展史
20 世紀的科技發展速度真的很快,就在 1944 年,J. Presper Eckert 就發明出了一種優化方案,叫「延遲線儲存器」(Delay Line Memory)。
原理如下,拿一個管子裝滿液體,如水銀,管子一端放揚聲器,另一端放麥克風,揚聲器發出脈衝時會產生壓力波,壓力波需要時間傳播到另一端的麥克風,麥克風將壓力波轉換回電訊號。
這個延遲線儲存器的原理,就是通過用壓力波的傳播延遲來儲存資料。
有壓力波代表 1,沒有代表 0。通過內部電路連線麥克風和揚聲器,再通過放大器來彌補訊號衰弱,從而實現一個儲存資料的迴圈。
研究出這個技術之後,Eckert 和同事 John Mauchly 使用延遲線儲存器做了一個更大更好的計算機叫 EDVAC,總共用了 128 條延遲線,每條能存 352 位(bits),總共能存 45,000 位,這也是最早的「儲存程式計算機」之一。
但「延遲線儲存器」也有一個很大的缺點:每一個時刻只能讀一位 (bit) 資料,並且只能順序讀取。所以又叫「順序儲存器」或「迴圈儲存器」。
因為這個原因,延遲線儲存器在 1950 年代中期就基本過時了。出現了一項新的替代技術,效能、可靠性更高,而成本更低的儲存技術 —— 「磁芯儲存器」。
給磁芯繞上電線,並施加電流,可以將磁化在一個方向,如果關掉電流,磁芯保持磁化;如果沿相反方向施加電流,磁化的方向(極性)會翻轉,這樣就可以用來區別儲存 1 和 0。
通過把磁芯排列成網格,由電線來負責遴選行和列,也由電線貫穿每個磁芯, 用於讀寫一位(bit)。
磁芯記憶體的第一次大規模運用是 1953 年麻省理工學院的 Whirlwind 1 計算機,磁芯排列是 32×32,用了 16 塊板子,能儲存大約 16000 位(bit)。更重要的是,不像「延遲線儲存器」,磁芯儲存器能隨時訪問任何一位(bit),這在當時非常了不起。
「磁芯儲存器」從 1950 年代中期開始成為主流,流行了 20 多年。
但因為工藝問題,一般是用手工編織製作,所以成本較高,大約 1 美元 1 位(bit) 。到 1970 年代,通過技術革新才下降到 1 美分左右。
不過即使每位 1 美分也很貴,現在我們的手機隨便拍張照片都有 10 多MB,10MB 約等於 8000 萬 bit,你願意花 80 萬美元存一張照片嗎?
願意的話可以文末掃碼聯絡我,我給你打 5 折...
同期, 1951 年 Eckert 和 Mauchly 創立了自己的公司,設計了一臺叫 UNIVAC 的新電腦,最早進行商業銷售的電腦之一,它推出了一種新儲存:磁帶。
磁帶是纖薄柔軟的一長條磁性帶子卷在軸上,磁帶可以在「磁帶驅動器」內前後移動,裡面有一個"寫頭"繞了電線,電流通過產生磁場,導致磁帶的一小部分被磁化,電流方向決定了極性,代表 1 和 0。
還有一個「讀頭」,可以非破壞性地檢測極性。UNIVAC 用了半英寸寬,8條並行的磁帶,磁帶每英寸可存 128 位資料,每卷有 1200 英尺長,意味著一共可以存 1500 萬位左右,接近 2 兆位元組。
用於計算機的磁帶直到 1980 年代才被廣泛應用,由於磁帶是循序存取的裝置,尤為適合傳統的儲存和備份以及順序讀寫大量資料的使用場景。但因為速度較慢,且體積較大等缺點,現在主要僅用作商業備份等用途。
1950、60年代,有個類似「磁帶」的技術是「磁鼓儲存器」,有金屬圓筒,蓋滿了磁性材料以記錄資料,滾筒會持續旋轉,周圍有數十個讀寫頭,等滾筒轉到正確的位置讀寫頭會讀或寫 1 位(bit) 資料,為了儘可能縮短延遲, 鼓輪每分鐘可以達到上千轉。
到 1953 年,磁鼓技術飛速發展,已經可以買到存 80,000 位的「磁鼓儲存器」,也就是 10 KB。
但到 1970 年代「磁鼓儲存器」不再生產,然而,磁鼓技術也直接導致了硬碟的出現。
硬碟和磁鼓很相似,不過硬碟用的是盤,不像磁鼓用圓柱體,因此得名。原理是一樣的,磁碟表面有磁性,寫入頭和讀取頭可以處理上面的 1 和 0。
硬碟的好處是薄,可以疊在一起,提供更多表面積來存資料。硬碟由 IBM 在1956 年開始使用,在 1960 年代初成為通用式電腦中主要的輔助存放裝置,隨著技術的進步,硬碟也成為伺服器及個人電腦的主要元件。
世上第一臺磁碟計算機是 IBM 的 RAMAC 305,1956 年誕生,它有 50 張 24 英寸直徑的磁碟,總共能存 5 MB 左右,但卻相當於兩個冰箱的體積。
1970 年代,硬碟大幅度改進並變得普遍,這一年 IBM 3340 問世,它擁有「溫徹斯特」這個綽號,來源於它的兩個 30MB 儲存單元,恰好是當時出名的「溫徹斯特來福槍」的口徑和填彈量。至此,硬碟的基本架構被確立。
1980 年,兩位前 IBM 員工創立的公司開發出 5.25 英寸規格的 5MB 硬碟 ST506,這是首款面向桌上型電腦的產品,而該公司正是希捷科技公司。
但直到 1990 年代,一些硬碟若是受到了較大幅度的震動或磕碰,都很有可能損壞,許多人也在當時養成了在關閉硬碟後 30 秒至一分鐘內、不會行動硬碟(及膝上型電腦)的習慣。
2010 年,氦氣封裝技術量產,除了讓硬碟的容量變大外,溫度和耗電能夠再降低,耐用度和穩定性獲得了大幅提升,電源關閉及遇到較大震動時磁頭會立刻移到安全區,這讓防摔能力也有了大幅進步。2011年,希捷宣佈與三星強化策略夥伴關係,傳統的硬碟也正逐漸地被固態硬碟所取代。
最後就到了我們相對比較熟悉的「軟盤」和「光碟」。
軟盤除了磁碟是軟的,別的和硬碟基本一樣。第一個軟盤同樣是由 IBM 於1971年開發出的,直徑 8 寸。隨著硬體技術的發展與使用的需要,又派生出 5.25 寸的軟盤,並廣泛使用在 Apple II、IBM PC 及其他相容電腦上。
蘋果 1984 年在 Mac 機開始採用 3.5 寸軟盤,此時容量還不到 1MB,後來,由日本索尼的 3.5 寸軟碟片容量有 1.44MB 所取代,這種軟碟片 80 至 90 年代盛行,直至 2000 年代以前,3.5 寸軟盤驅動器仍是電腦普及裝置之一,之後才漸漸被淘汰,現在的 00 後應該都沒見過了。
隨著光學儲存器的出現,「鐳射盤」在 1972 年出現,也就是我們熟悉的光碟(簡稱 CD)以及 90 年代流行的 DVD,功能和硬碟軟盤一樣,都是存資料,但用的不是磁性,光碟表面有很多小坑,造成光的不同反射,光學感測器會捕獲到,並解碼為 1 和 0。
如今,儲存技術在朝固態前進,不再使用傳統的機械活動部件,比如固態硬碟和 U 盤,裡面是積體電路,但由於價格及儲存空間與機械硬碟暫時還有不小的差距,固態硬碟暫時恐怕也還無法取代機械式硬碟。
第 3 章 新世代的儲存介質
1. 世界最小儲存介質
自從硬碟被髮明以來,科學家一直努力試圖開發新型製造工藝,讓磁儲存介質尺寸更小,同時排列更密集,從而可以儲存更多的資訊。
在 IBM 聖荷西研究院工作的一個國際研究團隊近日宣佈,他們成功地創造了目前世界上尺寸最小的磁體 —— 這個磁體僅由單個原子組成。同時,他們還成功地實現了利用這一微小的磁體來儲存一個位元的資料。
這次的突破依靠的是 IBM 長達 35 年的奈米技術研究,包括榮獲諾貝爾獎的掃描隧道顯微鏡。本週早些時候,IBM 宣佈它將為商業和科學用途打造全世界首個商用量子計算機。在未來的掃描隧道顯微鏡研究中,將調查使用單個磁體原子執行量子資訊處理的潛力。
2. 用玻璃作為儲存介質
早在 2012 年,日立公司就釋出了一項新技術用石英玻璃作為儲存介質。這項儲存技術的儲存單元由邊長 2 釐米,厚度 2 毫米的正方石英玻璃組成,每平方英寸可儲存 40MB 資料,資料是通過石英玻璃上的鐳射作用點按照四層結構以二進位制的格式進行燒錄的,可使用普通的光學顯微鏡讀取。
這種技術是以二進位制方式儲存資料的,通過在石英玻璃薄片上製造點陣將資料記錄下來,而且只需通過普通的光學顯微鏡就能讀取。
而想要讀取這些資料,只需要對電腦進行簡單的程式設計就可以了。所以不管以後的電腦有多先進,這些資料將永遠可讀。這塊石英儲存介質原型大小約為2平方釐米,厚度僅為2毫米,由石英玻璃製成,這是一種高穩定性的有彈力的材料,一般用於製作燒杯等實驗室器具。
日立稱,石英玻璃即使是在 1000 攝氏度的環境下兩個小時,上面儲存的資料也不會被破壞,此外,石英玻璃儲存還可防輻射、防水和防各種化學物。
這種薄片能抵抗很多化學物品侵蝕,不受無線電波干擾,而且可以直接暴露在高溫的火焰裡。而且它還防水,這意味著它可以安然度過火災或海嘯等自然災害。也就是說,除非你把它扔進太陽裡,或者弄成碎片,否則這些資料基本上是可以永久儲存的。
石英玻璃儲存介質沉寂一段時間之後,微軟公司給我們帶來了新訊息。11 月 4 日,在微軟 Ignite 2019 大會上,執行長薩蒂亞•納德拉展示了該公司 Project silicon 專案長期資料儲存解決方案。
Project silicon 專案使用超快鐳射光學和人工智慧將資料儲存石英玻璃上。該玻璃儲存設別尺寸為 75752(mm),最多可以容納 75.6GB 的資料。微軟官方表示該技術尚處於開發階段,隨著技術的迭代,未來這款玻璃硬碟將會有更大的容量。
在與華納兄弟娛樂公司的合作下,這個團隊將 1978 年的《超人》電影儲存在一塊玻璃上,大小和一個飲料杯墊差不多。
3. GitHub 的南極儲存計劃
上週 GitHub 宣佈,為了把開源軟體留給子孫後代,將在 2020 年 2 月 2 日為所有公共儲存庫生成快照,儲存在北極一個地下 250 米的廢棄煤礦,快照儲存在膠片上,壽命高達 1000 年。
AWA 是挪威國有采礦公司 Store Norske Spitsbergen Kulkompani(SNSK)與長期數字儲存提供商 Piql AS 的一項聯合計劃,AWA致力於永久儲存檔案。膠片卷軸將被儲存在位於斯瓦爾巴群島偏遠群島的一座退役煤礦內的密封室內的鋼壁容器中。
至今為止,AWA 已經儲存了來自義大利,巴西,挪威,梵蒂岡和許多其他國家的歷史和文化資料。
更多相關資訊,可以點選連結檢視相關文章:《GitHub 啟動程式碼永久儲存計劃,為人類文明留“火種”?》
第 4 章 研究儲存介質的意義
對於我們大多數人來說,資料儲存變得越來越容易。但是,人類一直在探究著如何穩定、大量地將資料儲存起來。
2001 年賈伯斯釋出 iPod 時,炫耀的說:“1美元硬幣大小的硬碟,足足可以存放1000首歌曲!”而現在,一張銀行卡大小的原子硬碟卻能存放整個 iTunes 音樂庫,這已經不僅僅是數量上的變化了。
但這還遠遠不夠,就像開頭我們說的, 2020 年全球產生資料量將超過 40ZB,到 2025 年,估計每年將會產生 160ZB 的資料,這比可觀測的宇宙中的星星還要多。
另一方面,隨著社會的文明程度越高,我們對於文化的傳承與儲存就越加迫切,對於資料的安全和儲存也有著更高的期待。前不久奇葩說中的那道辯題 —— “圖書館著大火,救貓還是救名畫?”如果我們能有一種儲存介質,可以永久、安全、穩定的儲存我們的文化遺產,這樣的問題也就不會發生。
還是那句話,就像 GitHub 的程式碼永久儲存計劃一樣,希望我們的歷史和文化,在千萬年之後能被下一代「地球接班人」發現,估計挺有意思的~
歡迎大家在文末留言,我們會在留言中挑選一位幸運的朋友隨機贈送一份小禮物哦( ?:技術圖書、谷歌周邊、GitHub 公仔、思否官方周邊等等等等等等等)。
-END-
掃碼加好友,一起變博學