對於網際網路使用者來說,搜尋是一件非常簡單的事情。在搜尋框輸入關鍵詞,回車(或點選搜尋框),等待。而對於搜尋公司來說,這是一個複雜的技術問題。從你開始搜尋到獲得結果的短暫時間裡,究竟發生了什麼?從 Google 發給 Mashable 網站的這幅資訊圖裡,我們可以瞭解到一些相關的資料。
搜尋之前
在你進行搜尋之前,Google 的搜尋爬蟲已經走遍了整個網路,它們從一個連結跳到另一個連結,將資料帶回 Google 的伺服器。網路就像是一本書,Google 的工作就是為圖書建立目錄。
Google 建立的目錄,其容量已經超過 1 億 GB。目前為止,Google 已經花費了 100 萬個機器小時來構建目錄。
搜尋之時
從查詢開始到獲得結果,搜尋查詢的平均旅行路程是 1500 公里。在此過程中,它可能經過全球不同的資料中心。根據 Google 的說法,1500 是一個平均數字,具體到每次搜尋產生的路程不會這麼長,因為 Google 總是會尋找最近的資料中心。在使用者鍵入搜尋查詢的時候,Google 就開始提供對查詢的預測,以減少鍵入時間,這就是 Google Instant。
排名
Google 的排序演算法會根據 200 多個訊號來決定相關結果。每年,Google 對排序演算法有 500 多項改進。這些訊號包括:
網頁內容的新鮮程度;網站內容的質量;網頁的地址和標題;其它網站對某特定站點的連結,以及這些連結的權威性;最好的搜尋結果是什麼,網頁、圖片、視訊、新聞、個人結果等;網頁上的單詞;拼寫檢查;個性化(與你關聯的人推薦的結果)。
搜尋結果
搜尋結果根據相關性排序,同時,Google 還提供了網頁預覽功能。
每天在 Google 上產生的搜尋超過億次;網頁預覽的平均載入時間是 1/10 秒;從 2003 年以來,Google 已經回答了 4500 億個新查詢;每天都有 16% 的新查詢出現。