由“網路垃圾”(Webspam)釋出的報告可知,谷歌搜尋在 2021 年過濾的垃圾網站數量、竟是 2020 年的六倍。據悉,作為 Alphabet 旗下子公司,Google 有一套名為 SpamBrian 的人工智慧垃圾過濾系統,並且可在超過 99% 情況下實現“不受垃圾所困擾”(spam-free)的搜尋體驗。
(來自:Google Search Central Blog)
此前,SpamBrain 已被這家搜尋巨頭用於防止使用者點選那些可能被注入了惡意軟體的有害網站、或旨在誘騙人們洩露個人資訊 / 匯款的詐騙站點。
Google 表示,鑑於垃圾資訊散播者在持續不斷地找到繞過過濾機制的方法,基於人工智慧的篩查系統也是相當必要的。
需要指出的是,搜尋是 Google 的重要收入來源之一。而高質量和安全的網站搜尋結果,也對該公司來說至關重要。
經過多年摸索,垃圾網站製作方早已精通搜尋引擎優化(SEO)技術,來人為地提升其搜尋排名。
作為應對,Google 也迫切需要排除掉那些利用欺詐演算法的垃圾網站。
截至目前,Google 已藉助 SpamBrain 將垃圾站點砍掉 70%,其中包括被黑客入侵併植入有害程式碼的感染站點。若被其得逞,受害者將被竊取登入憑據等機密資訊。
其它型別的垃圾站點,還涉及將惡意軟體注入受害者的計算機、或誘導重定向至惡意站點。慶幸的是,Google 聲稱 SpamBrain 能夠將這類害群之馬排除在搜尋結果之外。
Google 政策溝通經理 Ned Adriance 在一封電子郵件中提到:
欺詐者經常拙劣地模仿其它網站,常見套路是填充替換關鍵詞、假借品牌徽標、並附上想要引誘受害者撥打的電話號碼。
而 Google 的 SpamBrain 演算法方案,能夠基本上確保此類欺詐型站點出現在相關搜尋結果頁面中,且過濾了 75% 的亂碼垃圾站點。
這些垃圾站點往往在一堆無意義的文字中填充大量關鍵詞,以試圖提升其搜尋排名。有時甚至會砸錢掛上垃圾連結,來誘騙搜尋引擎的爬蟲和抬升 PageRank 品質評分。
對於使用者來說,時間總是相當寶貴的。而 Google 的各種解決方案,就希望為使用者帶來更好的內容檢索體驗。
【背景資料】
Google 於 2018 年推出的 SpamBrain 系統,且與近 20 年前剛開始治理惡意網站時相比,去年搜尋過濾的垃圾站點數量已暴增 200 倍。
即便如此,這場“道高一尺魔高一丈”的垃圾資訊攻防戰,顯然不會輕易完結。
自 cnBeta.COM