此前在朋友圈刷屏的“搜尋引擎百度已死!”一文作者“方可成實驗室”,近日再發文爆料,在百度搜尋廣州大量小學和幼兒園時,排在第一位的百度百科底部的參考文獻連結被指向了色情網站,引發諸多網友熱議,隨後百度方面也介入處理。
百度
百度百科外鏈指向色情網站怎麼回事?
據爆料,一位廣州的家長在微博上給“方可成實驗室”發來私信,他發現:在百度中搜尋廣州的很多小學和幼兒園的名字,結果中排在首位的一般都是百度百科,而進入百度百科頁面之後,點選參考文獻中的“廣州上學網”,卻會進入色情網站。
隨後深入分析會發現,廣州有大量的小學、幼兒園百科參考連結也有類似的問題,測試發現至少還包括:
廣州開發區第二小學、廣州市海珠區星雲幼兒園、廣州市越秀區大沙頭中英文幼兒園、沙河小學、北山小學、化龍中心小學、濱江東路第二小學、左邊小學、復甦小學、五鳳小學、芳華小學、協和小學、廣州市海珠區江南西藝星幼兒園、廣州市越秀區黃金實驗幼兒園、小洲小學、僑樂小學、金影小學、培紅小學、天河區龍洞小學、同福西路小學、聚德西路小學、博雅小學、天河區棠下小學、長安東街小學、增滘小學、禾豐小學、長湴小學、天河區駿景米洛英文幼兒園、瑞寶花園小學、黃村小學、廣雅實驗學校、橫沙小學、花都區新華鎮九潭小學、從化市從化英才幼兒園、樂賢坊小學、黃埔同仁小學、握山小學、三善小學、....。
為什麼會出現廣州小學和幼兒園大量百度百科參考連結指向色情網站呢?
作者隨著分析發現,以上這些廣州小學或幼兒園的百度百科的參考連結都是指向之前的“廣州上學網”。“廣州上學網”此前是一個真實的學校資訊綜合彙集網站,這些學校的百度百科頁面在編寫的時候,確實是指向了真正的“廣州上學網”。
但後來,“廣州上學網”網站關閉了,內容無法再訪問。再後來,“廣州上學網”的域名被色情網站運營者買下,設定成了自動跳轉色情網站。這樣一來,所有原本指向“廣州上學網”的連結,現在都會被跳轉到色情網站。
所以,這次百度是躺槍了?都怪色情網站太狡猾,百度對此並無責任?雖然說比較避免,其實,沒有檢測和處理過期連結也是一個不可逃避的問題。
過期連結問題一直也是網際網路面臨的一大挑戰,我們可以對比一下維基百科是怎麼做的。為了處理過期連結問題,維基百科特別制定瞭如何處理過期連結的詳細規則。
過去幾年中,在網際網路檔案館(Internet Archive)的幫助下,維基百科還利用機器人自動檢測失效連結,並替換為有效的歷史存檔連結,搶救了多達900萬個失效連結。
簡單來說,百度只要分配一些人工智慧資源給百科失效連結檢測,就不會出現今天的這種現象。另外,根據時光機網站抓取頁面顯示,從2018年開始,百科中的“廣州上學網”連結就已經開始跳轉到了色情網站,只不過很多人可能沒有注意到或者曝光,直到這次被曝光了出來。