很多人都知道谷歌在去年推出了一個叫做 RankBrain 的機器學習人工智慧系統來對搜尋結果進行排序,這可能是山景城(谷歌總部所在地)最新的一項偉大發明。但不是所有人都知道這個系統對整個 SEO(搜尋引擎優化)產業的影響有多大。在這篇文章中,我將會帶你詳細瞭解以前的 SEO 規則如何失效,而為了你的生意你應該如何進行順應潮流的 SEO。
在我們預測未來之前,讓我們先回顧一下 RankBrain是如何改變 SEO 的。我現在跟 Market Brew 的 CTO Scott Stouffer 坐在一起,Market Brew 是一家專為財富 500 強公司提供搜尋引擎優化的公司。作為一名搜尋引擎工程師,Stouffer 對 SEO 產業過去十年的發展有著很多獨特觀察。以下是他對加入了人工智慧後的 SEO 工作的幾點建議。
一、當前的迴歸分析有著嚴重的錯誤
迴歸分析(regression analysis)是當前 SEO 產業最大的謬誤。每一次谷歌的排名演算法調整時都會出現一大批預言家,通常我們這個行業裡的一些資料科學家和知名公司的 CTO 們會宣稱他們對谷歌的收錄重新整理(Google Dance:Google搜尋引擎資料庫每月一次的大規模升級)有自己的應對之道。典型的分析包括審閱過去幾個月的排名資料事件,然後觀察新的排名規則正在偏向於哪些型別的網站。
通過當前的這種迴歸分析,這些資料科學家們會指出某種型別的網站已經被影響了(排名上升或者排名下降),然後十分確信地得出一個結論:谷歌的最新排名演算法就是為這種型別的網站設計的。
然而,這已經不再是谷歌的工作模式了。谷歌的機器學習和深度學習演算法 RankBrain 正在以一種非常不同的方式工作。
谷歌內部存在著許多核心演算法,而 RankBrain 的工作就是學習這些核心演算法並將其應用到不同型別的搜尋結果排名中。舉個例子,RankBrain 可能已經知道一個網頁最重要的標誌是它的標題標記(META Title)。
在標題標記上多增加關注可能會帶來更好的搜尋體驗,但是在不同的搜尋結果中,相同的標題可能會帶來完全不同的搜尋體驗。因為在不同的垂直領域中,其他的演算法——例如 PageRank——可能被提升了。
這就意味著,在每一個搜尋結果中,谷歌都使用了不同的混合演算法。現在你就可以明白為什麼僅僅對每個頁面進行迴歸分析,而不是分析搜尋結果的文字,是一個超級謬誤了。
在這個意義上,現在的迴歸分析應該分析每一個具體的搜尋結果,而不是網頁本身。Stouffer 最近寫了一篇文章認為通過一種搜尋模型的方法能夠幫助我們解決谷歌演算法調整的問題。首先,你可以簡要得了解一下搜尋引擎模型在過去的一段時間為某個特定的關鍵詞做出了何種調整。然後,在確定新的已經被調整過的搜尋引擎模型並將其測定出來,然後為兩種搜尋引擎模型設定做一個三角分析。通過這種方法以及確定的模型調整分析,你就可以看到某種特定的演算法在調整中是被加權了還是降權了。
有了這些知識,我們可以為不同的搜尋結果定製和升級特定的 SEO 策略。但是相同的方法無法適用於所有的搜尋結果。這就是 RankBrain 是在搜尋結果(或關鍵詞)的層面上操作的原因。它其實是在為不同的搜尋結果定製演算法。
二、專注自己的垂直領域以避免被錯誤地分類
谷歌最近還意識到他們可以讓 RankBrain 這個深度學習系統知道好網站和壞網站長什麼樣。跟如何為不同的搜尋結果定製演算法一樣,他們還意識到不同垂直領域有著不同的好網站和壞網站的樣本。這無疑是因為不同領域有著不同的 CRM(客戶管理系統),也就是根據資料結合得出的不同的模型和不同的結構。
當 RankBrain 執行時,他們必須學習每種環境對應哪種正確的設定。你可能已經猜到了,這些設定完全取決於對應的垂直領域。因此,例如在健康產業,谷歌知道像 WebMD.com 這樣的網站的聲譽比較好,所以這個網站的搜尋結果就會比較靠前。而與 WebMD 的網站結構相似的其它網站就會被與「好網站」聯絡起來。類似的,任何與知名垃圾醫療網站的結構相似的網站都會與「壞網站」聯絡起來。
當 RankBrain 把「好網站」和「壞網站」聯絡起來工作時,用的是它的深度學習能力,但如果你的網站結合了很多不同領域的內容呢?
首先,我們得更詳細地討論這種深度學習是如何工作的。在將一個網站歸類到「好網站」和「壞網站」之前,RankBrain 必須首先確定每個網站的分類結構。對於 Nike.com 和 WebMD.com 這樣的網站來說當然是很簡單的。每個網站都會有不同的分類目錄,而其總目錄則是非常簡單直接的。所以這種網站會很容易分類。
但是對於有著不同的分類目錄的網站來說,例如 How-To(類似於百度經驗,提供針對各種事情的解決方法)類的百科網站,它們有相當多的資訊分類目錄。在這些案例裡,深度學習程式就會失效。那麼谷歌是在用哪些資料進行排序的呢?答案是:隨機。例如對於維基百科這樣的網站,谷歌會將其排出在 RankBrain 的控制之外,以確保這個深度學習系統不會破壞當前的搜尋體驗。
而對於那些不如維基百科這般知名的網站會怎麼樣呢?答案是:誰知道呢?大概這個機器學習系統能在將它們進行對比之前對它們進行分類吧。我們還是說一說像 WebMD 這樣的網站吧。
如果分類程式認為這個網站是關於鞋子的,那麼它就會將其與 Nike 的網站結構做一下對比,而不是 WebMD 的。如果一個賣鞋的網站有著和 WebMD 的網站一樣的結構,而不是像 Nike 這樣的,那麼它就很有可能被判為垃圾網站。而對於 How-To 類網站來說,最好是將不同的垂直領域劃分到不同的子域名下,以方便 RankBrain 進行分類。
三、反向連結
讓我們來看看 RankBrain 如何影響反向連結(backlinks)。基於以上的分類程式來判斷,你的網站上的友情連結也會讓 RankBrain 知道你是否屬於這個垂直領域。
還是舉以上的例子,如果一家公司擁有一個關於鞋子的網站。我們知道 RankBrain 的深度學習系統將會嘗試將這個網站的每一個方面與鞋子產業的最好和最壞的網站進行對比。因此,很自然地,這個網站的反向連結也會被拿來與那些最好的和最壞的網站的反向連結進行對比。
我們假設一個聲譽良好的鞋子網站有來自以下網站的反向連結:
- 體育
- 健康
- 時尚
現在假設這家公司的 SEO 團隊決定增加來自這些網站的反向連結。而因為這家公司的老闆此前在汽車行業工作,因此他有很多汽車行業的資源。所以 SEO 團隊決定再加上一些來自汽車產業的反向連結。他們在一個汽車行業網站上打了一個互推廣告,指向他們的網站的連結是一個關於“新鞋租賃服務”的頁面。看起來很和諧,對嗎?
但是,RankBrain 會認為這種反向連結與其他聲譽良好的鞋子網站看起來不一樣。更糟糕的是,它還發現很多關於鞋子的垃圾網站也有一堆來自汽車行業的反向連結。所以,在不知道什麼是正確的反向連結的情況下,RankBrain 已經從搜尋結果中嗅到了什麼是「好網站」和什麼是「壞網站」的跡象了。所以這個新網站被打上了「壞網站」的標籤,網站流量急速下降。
四、人工智慧和 SEO 的未來
加速回報定律(Law of Accelerating Returns)告訴我們,像 RankBrain 這樣的人工智慧將很快在某些領域超越人腦。從這個角度上看,沒有人知道這項技術會將我們帶向何方。
然而這些東西是確定的:
- 每一個競爭激烈的關鍵詞領域都需要自我檢討
- 每個網站都需要專注自己的垂直領域以避免被錯誤地分類
- 每個網站都需要向自己所在領域的頂級網站學習結構和內容
在某些情況下,這種深度學習演算法讓 SEO 變得相對簡單了。因為我們已經知道 RankBrain 和類似的技術已經和人腦不相上下了,所以規則就會很明確:沒有任何空子可鑽。
另一方面,情況又更加複雜了,SEO 仍將是一門技術活。分析學和大資料將會成為主流,任何 SEO 從業人員如果不熟悉這些方法的話,都會遇到很多困難。而擁有這些技能的人將會坐等加薪。
©本文由機器之心編譯