Internet Archive今日達成了一項里程碑式成就,其網站歷史資訊查詢服務工具Wayback Machine收錄了4千億網頁索引。資料涵蓋了從1996年至今的幾乎所有網站的歷史網頁記錄。

以下是Internet Archive總結的Wayback Machine的歷史和里程碑:

2001年 – Wayback Machine專案啟動

2006年 – Arichive-It啟動,允許建立訂閱該服務的庫以收集網路內容

2009年3月25日 – Internet Archive和Sun微系統公司共同啟動了一個資料中心,儲存整個網際網路的文件及為Wayback Machine提供服務。該資料中心有3PB容量,每秒處理500個請求。

2011年6月15日 – 加入HTTP Archive,增加記錄網站效能資料的功能。

2012年5月28日 – Wayback Machine在中國被封鎖數年後再次上線。

2012年10月26日 – 被記錄網站抓取資料達到了80TB,該抓取資料在2011年面向研究者開放。

2013年10月 – Wayback Machine新功能“儲存頁面”開放,可以在頁面被記錄後一小時再檢視最新的內容;聯邦政府關閉期間也可以通過該工具訪問政府站點。

自:cnbeta