索引擎如何識別網站本地特性

Web開發者發表於2012-02-12

在使用谷歌的時候,會發現有“中文網頁、中國的網頁”等選項,如果使用者搜尋“中國的網頁”,則針對中國地區使用者的網頁就會顯示出來,如果您的網站是針對新加坡使用者的,當然也沒必要出現在結果中了,那麼搜尋引擎如何識別網頁的本地性呢?

從網站IP所在地識別目標地理區域
一般情況下針對中國使用者的網站是放在中國的鏡內,所以從IP上能夠區分網站針對哪個地區的使用者。這也是很有道理,即使一個英文的網站,放在中國境內,也有可能被識別為中國的網頁。疑問:中文站放在美國空間就不能識別為中國的網頁了嗎?

從網站所使用的域名
如中國.cn,美國.us。但是一般商業站等都用國際性域名,不能用地區域名區分了。

網站所使用語言和字元編碼
顯而易見,如果網頁使用GB2312編碼(肯定是簡體中文了),那麼網站很可能是針對中國使用者的。疑問:1.中文也可以用於新加坡使用者啊?2.我使用utf8編碼就識別不出來了嗎?

一個使用GB2312編碼的中文網站,伺服器放在中國境內,很容易被識別為“中國的網頁”。但現實情況很複雜,正如上面列出的疑問,如何解決呢?

給網頁設定語言地區程式碼
例:一個針對新加坡使用者,既有中文又有英文的網站(肯定用utf8了),伺服器放在美國。這時從編碼、語言和 IP上都不能識別為“新加坡”了,那搜尋引擎如何識別本地特性呢?對,那就是常常被人忽略的(這時不能忘記它了):設定網頁國家地區語言程式碼。這個屬性由兩部分組成,語言程式碼:en,zh即英文,中文;國家和地區程式碼:SG、CN即新加坡,中國大陸。因此,只要英文網頁設定:en-SG,中文網頁設定:zh-SG,這樣一個“針對新加坡使用者,使用utf8編碼,中英兩種語言,伺服器放在美國”的網站本地設定就搞定了。

當然,應該還有其它的因素識別,如連結情況、訪問的使用者的所在地區等,但上面如果設定錯誤,這將讓搜尋引擎花費更久的時間來識別本地性。

相關文章