隨著經濟全球化的不斷髮展,我們的使用者受眾不再僅僅是當地國家,多語言多區域的網站、平臺越來越多。如果您有一個或多個以多種語言面向國際或不同國家、區域提供不同內容的入口網站,那您需要盡最大的努力擴大您的國際受眾範圍,確保網站在全球範圍內被注意到。這時,您就需要國際SEO了。
1. 什麼是國際SEO ?
首先,我來普及一下概念,
- 國際SEO, International SEO (國際搜尋引擎優化),是優化您的網站的過程,以便搜尋引擎可以輕鬆識別您要定位的國家、地區以及用於業務的語言。
- 多語言網站,是指使用多種語言提供內容的網站。例如,香港的企業向使用者提供繁體中文和英文的網站。
- 多區域網站,是指以不同國家、區域的使用者為目標受眾的網站。例如,某廠商,同時會向美國、加拿大、中國等多個國家發貨商品。
如下圖,搜尋引擎向不同地理區域的使用者展示不同的語言、幣種、計量單位的結果。搜尋引擎會嘗試向搜尋使用者提供與使用者的語言、區域最匹配最恰當的網頁版本,那麼,我們如何告知使用者和搜尋引擎哪些才是最匹配的網頁呢?
圖片來源於網路2. 國際站點的URL結構
首先,先介紹多語言多區域國際站點一般的URL結構,國際站點一般有4中方式來向使用者和搜尋引擎指明當前頁面所對應的國家、區域和語言。分別是ccTLD、子域名、子目錄、具有語言、區域引數的gTLD 。
-
ccTLD(國家頂級域 Country code top-level domain)
ccTLD ,根據Google的定義,ccTLD使用雙字母程式碼向使用者和搜尋引擎指明網站所在的國家、地區。
優點:
- 地理位置定位明確(作用減弱)
- 在目標使用者的搜尋結果頁面中排名更高
- 與伺服器位置無關
- 便於區分網站
- 如果您擁有財務和技術資源,使用ccTLD可能是個好主意。
缺點:
- 您需要付出更多努力才能獲得普及新域名,一起得從頭開始。
- 價格昂貴(並且可能存在使用限制,如需要備案、需要在本國存放伺服器)
- 需有更多基礎架構
- 全新網站,搜尋引擎不會將頁面權重從您的原始域名轉移到此域名,網頁需要重新索引。
提示:Google搜尋將不再使用域名來指示國家/地區服務。Making search results more local and relevant
eg:
domain.cn
-
gTLD的子域名(gTLD,通用頂級域 Generic top-level domain)
優點:
- 允許使用不同的伺服器位置
- 便於區分網站
缺點:
- 全新網站,不能繼承主域權重
- 本地化的優化過程更加複雜
eg:
cn.domain.com
-
gTLD的子目錄 — 國際化內容放置在根域下的特定子目錄或資料夾中。
優點:
- 維護成本用低
- 易於設定
- 見效快,更容易獲得搜尋引擎的新人,直接使用原網站權重,很快被索引
- 這是資源有限的企業的最佳選擇。
缺點:
- 提供弱的地理定位訊號
- 沒有針對不同子目錄的特定IP地址
- 更難維護不同版本的國家/地區目錄
- 搜尋引擎的處罰會影響到所有目錄
eg:
domain.com/cn
-
URL引數 (不推薦)
缺點:
- 引數不可靠,有時它們會被編入索引,有時則不會。搜尋引擎更喜歡唯一的URL
eg:
domain.com/?lang=zh-cn
最好的國際站點的URL結構是什麼,沒有標準答案。只能說,每種方法都有一些優點和缺點,適合自己的就是最好的。
3. 如何處理多語言多區域網站中的重複網頁
我們為多個國家提供同一種語言的內容,會造成重複頁面而受到懲罰嗎?答案是否定的。根據區域定位的本地化內容不是垃圾內容,有著正當的商業理由。
-
如果您在同一個多區域網站的不同網址以同一種語言提供類似內容或重複內容(例如,如果
example.de/
和example.com/de/
都顯示類似的德語內容),則應使用rel=canonical
設定一個權威版本。 -
使用hreflang標籤。
-
本地化關鍵字優化。
-
新增本地資訊,例如電話,貨幣,計量單位和地址等。
-
本地化的HTML站點地圖。
-
本地化導航。
-
與觀眾產生共鳴的本地化影象。
-
專業的翻譯、本地化的內容,而不是機器翻譯。
-
從本地ccTLD獲取指向您本地化內容的外部連結。
4. 使用語言標記確定您的網頁所針對的語言
國際SEO最大的問題之一就是重複頁面,解決此問題的最有效方法是使用 hreflang。這使得搜尋引擎能夠識別出應向特定使用者展示的最匹配的網頁版本。
例如,您有一個英文網頁面向多個國家,英國的搜尋使用者將搜尋到對應 hreflang="en-gb"
的網頁,而美國的搜尋使用者將搜尋到對應 hreflang="en-us"
的網頁。
(1)使用hreflang幫助搜尋引擎識別網頁版本
將 <link rel="alternate" hreflang="lang_code"... />
元素新增到網頁標頭中,以將網頁的所有語言和區域變體告知搜尋引擎。如果您沒有站點地圖或無法為您的網站指定 HTTP 響應標頭,此方法非常有用。
您應在 <head>
元素中為網頁的每個變體分別新增一組 <link>
元素(由每個網頁變體(包括網頁自身)的連結組成)。網頁的每個版本所對應的那組連結都應是相同的。
以下是每個 link
元素的語法:
<link rel="alternate" hreflang="lang_code" href="url_of_page" />
lang_code
此網頁版本所定位的受支援的語言/區域程式碼,或 x-default
(以與該網頁上的 hreflang
標記未明確列出的任何語言匹配)。
url_of_page
此網頁版本的完全限定網址(與指定的語言/區域對應)。
示例:
<head>
<title>Widgets, Inc</title>
<link rel="alternate" hreflang="en-gb"
href="http://en-gb.example.com/page.html" />
<link rel="alternate" hreflang="en-us"
href="http://en-us.example.com/page.html" />
<link rel="alternate" hreflang="en"
href="http://en.example.com/page.html" />
<link rel="alternate" hreflang="de"
href="http://de.example.com/page.html" />
<link rel="alternate" hreflang="x-default"
href="http://www.example.com/" />
</head>
複製程式碼
使用hreflang中的常見錯誤:
- 只有地區,沒有語言
- 地區在前,語言在後
- 使用了多個x-default
- 程式碼錯誤,如英國地區應該是GB ,而不是UK
(2)HTTP 響應標頭
您可以將相應網頁所有語言、區域的變體告知搜尋引擎,這種方法對不能設定 html 標記的 pdf 很有用。 標頭格式如下:
Link: <http://en-gb.example.com/page.html>; rel="alternate"; hreflang="en-gb", <http://en-us.example.com/page.html>; rel="alternate"; hreflang="en-us", ...
(3)XML sitemap 站點地圖
您可以使用站點地圖將每個網址的所有語言和區域變體告知搜尋引擎。為此,請新增一個用於指定單個網址的 <loc>
元素,其中的子 <xhtml:link>
條目應列出相應網頁的每種語言/語言區域變體(包括網頁自身)。因此,如果您的某個網頁有 3 個版本,那麼您的站點地圖便應包含 3 個條目,每個條目都應包含 3 個完全相同的子條目。
站點地圖規則:
- 按如下方式指定 xhtml 名稱空間:
xmlns:xhtml="http://www.w3.org/1999/xhtml"
- 為每個網址分別建立一個單獨的
<url>
元素。 - 每個
<url>
元素都必須包含一個指示網頁網址的 子元素。 - 每個
<url>
元素都必須包含一個子元素<xhtml:link rel="alternate" hreflang="supported_language-code">
,其中應列出相應網頁的每個備用版本(包括網頁自身)。這些子<xhtml:link>
元素的順序無關緊要。 示例: www.example.com/en
,以英語使用者為目標使用者。www.example.com/de
,以德語使用者為目標使用者。
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xhtml="http://www.w3.org/1999/xhtml">
<url>
<loc>http://www.example.com/en</loc>
<xhtml:link
rel="alternate"
hreflang="de"
href="http://www.example.com/de" />
<xhtml:link
rel="alternate"
hreflang="en"
href="http://www.example.com/en" />
</url>
<url>
<loc>http://www.example.com/de</loc>
<xhtml:link
rel="alternate"
hreflang="de"
href="http://www.example.com/de" />
<xhtml:link
rel="alternate"
hreflang="en"
href="http://www.example.com/en" />
</url>
</urlset>
複製程式碼
更多 sitemap 的相關知識請參考: sitemaps.org - Sitemaps XML format
(4)語言元標記
雖然Google和Yandex目前使用hreflang屬性,但Bing使用的是語言元標記 :
<meta http-equiv=“content-language” content =“en-us” />
(5)注意事項:
- hreflang 屬性的值用於標識備用網址的語言(以ISO 639-1格式表示)和區域(可選,以ISO 3166-1 alpha-2格式表示)。例如:
- de:德語內容,不限區域
- en-GB:英語內容,面向英國境內的使用者
- de-ES:德語內容,面向西班牙境內的使用者
- 請考慮為不匹配的語言新增後備網頁,尤其是在語言/國家/地區選擇器中或是在會自動重定向的主頁上。在這種情況下,請使用 x-default 值:
<link rel="alternate" href="http://example.com/" hreflang="x-default" />
- 備用網址必須是完全限定的網址,包含傳輸協議、域名。
- 備用網址無需位於同一個網域中。
- 如果兩個網頁沒有互指,系統將會忽略相關標記。
- 使用頁面標記或XML sitemap,最好不要同時使用兩者。
- Google開始根據搜尋者的位置生成搜尋結果,無論搜尋者使用的是哪個Google本地版本。
- 第三方工具推薦:
5. 使用 rel="canonical" 標記
- 使用 rel="canonical" link 元素標記所有重複的網頁。將屬性為 rel="canonical" 的
<link>
元素新增到重複網頁的<head>
部分中,並使其指向權威網頁,如下所示:<link rel="canonical" href="https://example.com/cn/" />
- 如果權威網頁有對應的移動版變體,請為其新增 rel="alternate" 連結,並使其指向此網頁的移動版:
<link rel="alternate" media="only screen and (max-width: 640px)" href="http://m.example.com/cn/”>
- 為此網頁新增適當的 hreflang 或其他重定向。
6. 需要專業的翻譯、本土化的內容
因為非常多時候由於搜尋詞的文化差異,一些語言的熱門關鍵詞在另一種語言的搜尋引擎中是沒有排名的。所以如果從你自己本身的語言文化出發,你可能會錯過很多將人們吸引到你網站上的神奇關鍵詞。
例如, 顏色,在英國是 colour ,而美式英語則是 color 。
伺服器,在香港叫伺服器;程式叫程式。
如果你將“市場研究”從中文翻譯成英文,最直接的翻譯是“market study”。但是翻譯成“case study“、 “market research” 您會得到更好的效果。
使用這些更親近本土搜素引擎的關鍵詞不僅意味著你的內容將更具流動性,同時也意味著你的內容比那些使用機器直譯關鍵詞的內容更容易被搜尋到,概率提高了50多倍。
market research, case study, market study - Google 趨勢7. 外鏈
我們有必要在與本網站相關的同語言網站、本地ccTLD網站中投放一些導向自身網站的外部連結。這是因為相較於不同語言的連結,搜尋引擎會給予同一種語言的連結更高的權重。
8. 適合當地市場的設計
設計、使用者體驗、網站架構 — 所有這些在SEO中扮演著越來越重要的角色。通過本地化設計,您可以減少重複內容。
不同國家的文化差異不僅影響你網站的內容或關鍵字,甚至可能影響整個網站。
不同國家,越來越多的人都在使用移動裝置來瀏覽網站,特別是在美國、日本、韓國這些高度移動化的國家,你有必要為網站做一個響應式設計。
不同文化的人們對於顏色的認識儘管有相似點,但他們對各種顏色的感覺會不同,甚至截然相反,其原因是由於國家所處的地理位置、歷史文化背景和風俗習慣不同。例如:綠色在中國象徵著新生與希望,而西方文化的人們會將綠色與“缺乏經驗”聯絡起來;在中國象徵著高貴與權力的黃色,在巴西被視為絕望的象徵;因此在為海外市場挑選官方用色時,你最好考慮當地人對顏色的感受。
9. 國際SEO中的常見誤區
-
使用 cookie 儲存區域、語言
一些網站將語言、區域資訊存在在cookie ,根據cookie來向使用者展示對應的頁面版本。而搜尋引擎在抓取頁面時並不支援cookie ,除了預設版本外,它什麼都看不到。同時,也建立了一個不太好的使用者體驗。例如,我訪問到一箇中文頁面,通過email向朋友轉發。朋友開啟的時候,因為他的瀏覽器中沒有設定中文的cookie ,頁面被重定向到了一個預設的英文頁面,他看到的並非我預期的結果。甚至,他若不認識英文,那他永遠無法找到這個中文版本的頁面。
-
Javascript 切換語言
一些網站通過 Javascript 來載入本地化內容,但不會更改不同語言、區域的URL,而且沒有不同的URL來匹配所訪問內容。這種情況下,由於搜尋引擎無法執行Javascript, 它除了訪問預設的版本外,永遠無法訪問其他區域語言的內容。同時,使用者也無法通過URL定位到本地化版本頁面。
-
根據IP、Accept-Language 自動重定向
這樣做往往不單影響收錄,也影響使用者體驗。原因有以下幾點:
- 大部分搜尋引擎只從少數IP地址進行抓取。
- 我們設定的IP庫通常不全。
- 重定向對頁面載入時間產生負面影響。
- 如果您使用外語網站,Chrome一般會問你不要翻譯,如果您選擇了不需要重複,Chrome 會把該語言放入請求頭Acept-Language當中。
- 搜尋引擎一般不會帶上Acept-Language。 事實上,Google已經改進並將繼續改進其區域設定感知抓取能力。截至2015年初,他們宣佈Googlebot將從世界各地的許多IP地址(而不僅僅是美國)進行抓取,並將使用Accept-Lang請求頭檢視您的網站是否根據使用者區域語言資訊設定並更改頁面內容。但同時,他們非常清楚這項技術並不完美,這並不能取代使用hreflang的建議。
相反,更好的使用者體驗是當您檢測到使用者可能會發現您的網站的另一部分更相關時,該橫幅就會出現。
來源於www.apple.com
www.ikea.com
永不使用自動重定向規則的一個例外是,當使用者選擇您網站上的國家、地區或語言首選項時,您應該將該首選項儲存在Cookie中,並在使用者訪問時將其重定向到其首選語言環境的版本頁面上。同時要確保他們可以隨時設定新的首選項,更新cookie。
-
新增hreflang標籤將有助於我的跨國內容排名更好
Hreflang標籤是國際SEO工具中最強大的工具之一。他們是成功的國際SEO策略的基礎。但是,它們並不是一個排名因素。相反,它們旨在確保在Google搜尋結果中顯示正確的本地化頁面。
-
使用旗幟圖示來表示網站的語言
旗幟不是語言,例如英國旗幟並不代表英語。對於說這種語言但不是來自該國家的任何使用者來說,代表語言使用者的國家旗幟是非常令人反感的。
來源於http://www.flagsarenotlanguages.com/
Flags symbolize nations, not languages -
需要本地伺服器來託管網站內容
因為Google和Bing過去曾明確表示,本地伺服器在是一個重要的國際排名因素。事實上Google 及其他搜尋引擎表示,現在本地伺服器並不像以前那麼重要。隨著CDN的普及,通常不需要本地伺服器。而您只需考慮的是,目標區域使用者獲取您的網頁速度的體驗優化。
-
國際搜尋引擎 == Google ?
雖然谷歌是迄今為止全球搜尋引擎中最常用的,但在一些國家,有一些本地的搜尋引擎比谷歌更受歡迎。如果您的目標受眾區域中包含這些地區,那您仍需要對其做好針對性的SEO 。 如:
- 中國(大陸地區)Baidu
www.baidu.com
- 俄羅斯和東歐國家 Yandex
www.yandex.com
- 韓國 NAVER
www.naver.com
- 中國(大陸地區)Baidu
10. 後話
相信現在,您已經對國際SEO有了一定的瞭解。隨著搜尋引擎的不斷髮展,文中的一些觀點也必定會過時,未來的您也應該帶著審視的眼觀來閱讀、理解此文。Let's do it .
參考文章: