[GoogleAPI](5)篩選結果

zergskj發表於2006-11-13

設定篩選條件

可以根據很多因素來限制 Google 搜尋。它們包括語言、內容、國家或地區和主題。您還可以控制輸入和輸出的編碼。

例如,Google 列出了國家或地區程式碼,允許您根據來源國家或地區限制資料。雖然在分發檔案 APIs_Reference.html 上有完整的清單,但是要將搜尋限制在包含片語 “science fiction” 的來源為 United Kingdom 的頁面上,請設定 restrict 引數:


Google 還指定了資訊的四組“特殊分類”:

  • U.S. Government (unclesam)
  • Linux (linux)
  • Macintosh (mac)
  • FreeBSD (bsd)

因此,為了搜尋歸在 linux 分類的 “science fiction” 頁面,請將限制條件設定成:


請注意,主題域並不總是如您所願的限制結果。例如,實際上在 linux 類中 “science fiction” 有 8710 個結果。

  有篩選條件的搜尋結果

這裡有一個樣本,是在 linux 類中搜尋到的 8710 個 “science fiction” 結果頁面:





您還可以將限制條件組合在一起,如:



  選擇語言

API 還提供了特定的引數限制結果的語言。


Google 能識別以下的語言程式碼:



  指定編碼

對於資訊在使用不同編碼的環境中來回傳輸的情況,API 使您可以以指定的方式設定輸入和輸出語言的編碼。例如:


在這種情況下,解釋查詢字串 searchTerm 時就好象它是用 greek 編碼的一樣,以 hebrew 編碼的結果將會被送回來。預設的編碼方式是 latin1。

  去除成人結果

上網衝浪相當長的時間而沒有注意到 Web 上有大量的成人內容是不大可能的。要去除搜尋集中的成人結果,請選擇安全搜尋:


如果 setSafeSearch 被設成 true,Google 就會使用一個檢查關鍵詞和片語、URL 和 Open Directory 目錄的過濾器。


  去除相關結果

在有許多相似結果的情況下,API 允許您只返回典型頁面。例如,如果開啟過濾功能,則對於標題和片斷極為相似的一組結果,Google 將只返回其中的第一個,而同一 Web 主機上則只返回前兩個結果。這樣使用者不但不會被同一個站點的結果困住,而且還能對那個站點上的可用內容有所瞭解。

API 允許您使用 setFilter() 方法將過濾功能關閉,但請注意程式碼樣本下面的注意事項。


注意,根據文件,當這個值設為 true 時,過濾功能開啟,而當為 false 時則過濾功能關閉。不過,看上去,情況似乎剛好相反,當這個值被設為 true 時則返回相關結果,而當它設為 false 時則排除結果集。

 


相關文章