網際網路檔案計劃(Internet Archive)

阮一峰發表於2007-11-16

bg2007111601.jpg

前幾天,我在Blog裡提到了"開放內容聯盟"(Open Content Alliance),當時我說這是"網際網路檔案計劃"(Internet Archive)的一部分。今天,我就來介紹一下這個非常非常重要和有用的"網際網路檔案計劃"。

就像它的名字一樣,這個計劃的目的就是為網際網路儲存一份檔案。在它的網站上,它這樣介紹自己:

Most societies place importance on preserving artifacts of their culture and heritage. Without such artifacts, civilization has no memory and no mechanism to learn from its successes and failures. Our culture now produces more and more artifacts in digital form. The Archive's mission is to help preserve those artifacts and create an Internet library for researchers, historians, and scholars. The Archive collaborates with institutions including the Library of Congress and the Smithsonian.

大多數社會都非常重視保護文化遺存。如果沒有這些遺存,那麼人類就將失去記憶,無法從過去的經歷獲得啟示。如今,越來越多的文化遺存以數字格式出現。"網際網路檔案計劃"的使命就是保護這些數字遺存,為人類創造一個網際網路圖書館。我們的合作單位包括國會圖書館和史密森學會。

目前,"網際網路檔案計劃"分為六大部分:

一、電子書

網址:http://www.archive.org/details/texts

這個部分,我以前已經介紹過了,它專門收集公共領域的書籍和文件,任何人都可以免費下載。截至到今天,共有29萬多種材料,堪稱網際網路上最好的公共領域圖書搜尋引擎。

它主要收集英語書籍,但也包括少部分其他語種的書籍,比如朱熹的《論語集註》

二、網頁

網址:http://www.archive.org/web/web.php

這個部分有個專門的名字,叫做"時光倒流機器"(Wayback Machine),它像收集舊報紙那樣收集舊網頁。舉例來說,Yahoo!的首頁就有5000多份檔案,最早的可以回溯到1996年10月17日,最近的則是2007年8月30日

要將全世界的網頁都儲存下來,這需要多大的儲存容量啊?根據2006年的統計,當時Wayback Machine的儲存容量有2000T,然後還在以每月20T的速度增加。

三、視訊

網址:http://www.archive.org/details/movies

這個部分收集視訊材料,你在其中可以找到動畫片電影。我感覺內容還不算很豐富,不過在其中經常可以找到有趣的內容,比如《如果抵禦殭屍的襲擊?》和1951年的好萊塢喜劇片《皇家婚禮》

四、音訊

網址:http://www.archive.org/details/audio

音訊材料主要是有聲書籍音樂。比如,你可以免費下載世界名著《簡愛》的MP3,以及巴赫的《 C小調第4奏鳴曲》等等。

五、軟體

網址:http://www.archive.org/details/software

軟體也是人類文化的一部分,儲存舊軟體同儲存舊書一樣,都是很有意義的。我在上面發現了Photoshop 6.0的DEMO版和Winamp 5.0

六、教育材料

網址:http://www.archive.org/details/arsdigita

這部分主要是美國大學課程,有視訊和文字材料下載,相當於不去北美就可以上那裡的課,比如麻省理工學院的《微分方程》和Naropa大學的《艾倫·金斯堡的詩歌》

最古怪的事情是,這裡居然有一個"中國大學課程"的欄目,裡面有14所中國高校的187門課程。當我在美國的網站上,聽到有人用中文給我講解《毛澤東思想和鄧小平理論概論》,我簡直有一種時空交錯的感覺。

(完)

相關文章