Wayback Machine收錄4千億網頁 涵蓋1996年至今歷史記錄

發表於2014-05-11

Internet Archive今日達成了一項里程碑式成就,其網站歷史資訊查詢服務工具Wayback Machine收錄了4千億網頁索引。資料涵蓋了從1996年至今的幾乎所有網站的歷史網頁記錄。

以下是Internet Archive總結的Wayback Machine的歷史和里程碑:

2001年 - Wayback Machine專案啟動

2006年 - Arichive-It啟動,允許建立訂閱該服務的庫以收集網路內容

2009年3月25日 - Internet Archive和Sun微系統公司共同啟動了一個資料中心,儲存整個網際網路的文件及為Wayback Machine提供服務。該資料中心有3PB容量,每秒處理500個請求。

2011年6月15日 - 加入HTTP Archive,增加記錄網站效能資料的功能。

2012年5月28日 - Wayback Machine在中國被封鎖數年後再次上線。

2012年10月26日 - 被記錄網站抓取資料達到了80TB,該抓取資料在2011年面向研究者開放。

2013年10月 - Wayback Machine新功能“儲存頁面”開放,可以在頁面被記錄後一小時再檢視最新的內容;聯邦政府關閉期間也可以透過該工具訪問政府站點。

更多可以參見: http://www.techcn.com.cn/index.php?edition-view-196173-4.html 

相關文章