SEO如何減少網站複製重複內容過多的問題?
複製內容也可以稱為重複內容。複製內容指的是兩個或多個URL內容相同,或非常相似。複製內容既可能發生在同一個網站內,也可能發生在不同網站上。
1、產生複製內容的原因
下面這些原因可能造成複製內容。曾慶平SEO前面討論的網址規範化問題會產生複製內容。
代理商和零售商從產品生產商那裡轉載產品資訊。這倒沒什麼不對,一般生產商也都同意,沒有版權問題。但是絕大部分代理商、零售商、批發商都是直接copy而不做任何改動,大家用的都是一模一樣的產品說明,所以這些電子商務網站上充斥著大量複製內容。
列印版本。很多網站除了正常供瀏覽的頁面外,還提供更適於列印的頁面版本,如果沒有用適當方式禁止抓取,這些列印版本網頁就會變成複製內容。
網站結構造成的各種頁面版本。如產品列表按價格、評論、上架時間等排序頁面,部落格的分類存檔、時間存檔等。
網頁內容由RSS生成。有很多網站,尤其是新聞類網站,用其他網站的 RSS feed 生成網站內容,這些內容在原始出處和很多其他類似網站上都已經出現過很多次了。
使用Session ID。搜尋引擎蜘蛛在不同時間訪問網頁的時候,被給予了不同的Session ID,實際上網頁內容是一樣的。由於Session 1D引數不同,就被當成了不同的網頁。
網頁實質內容太少。每個網頁上都不可避免地有通用部分,比如:導航條、版權宣告、廣告等。如果網頁的正文部分太短,內容數量還抵不上通用部分,就有可能被認為是複製內容頁面。
轉載及抄襲。有時是其他人抄襲了你的網站內容,有時是善意的轉載,有時是作者自己在不同網站釋出文章,這些都會造成複製內容。
鏡象網站。鏡象網站曾經很流行,當一個網站太忙太慢的時候,使用者可以通過替代鏡象來看內容或下載,這也有造成複製內容的風險。
產品或服務型別之間的區別比較小。比如有的網站把自己的服務按地區進行分類,但實際上提供給每個地區的產品或服務都是一樣的。這些按地區分類的頁面只是把地名改了改,其他服務內容說明全都一樣。 URL任意加字元還是返回200狀態碼。有的網站由於技術原因,使用者在URL後加上任意字元或引數,伺服器還能正常返回200狀態碼,並返回沒加上任意字元時一樣的重複內容頁面。
檢查頁面是否有複製版本相對簡單。拿出頁面正文中的一句話,加上雙引號,在搜尋引擎中搜尋一下,從結果中就能看到是否有多個頁面包含這句話。一般來說,隨機挑選的一個句子,完整出現在另一篇無關文章中的可能性很低。
2、複製內容的害處
很多SEO對複製內容有個誤解,認為網站上有複製內容,搜尋引擎就會懲罰。其實搜尋引擎並不會因為網站有少量複製內容而懲罰或降權。搜尋引擎做的只是從多個頁面中儘量挑選出真正的原創版本給予應有的排名,其他複製版本不在搜尋結果中返回或排在比較靠後的位置。
不過既然交給搜尋引擎去判斷,就有可能判斷失誤,把本來是原創的頁面當做轉載或抄襲的複製內容,因而排名不好。這對原創頁面來說確實就像是懲罰,不過不是因為複製內容本身,而是因為搜尋引擎判斷原創失敗。
同站出現複製內容看似沒有那麼嚴重,不管搜尋引擎判斷哪個版本是原創,都是自己網站上的頁面。問題是,搜尋引擎認為的最合適的URL與SEO站長自己認為的最合適的URL有可能不一樣,SEO站長優化和做連結時把精力放在頁面A,搜尋引擎卻認為頁面B最好(A與B內容一樣),SEO站長花在頁面A上的精力就浪費了很多。
同一個網站內的複製內容會分散權重。既然頁面在網站上出現,就必然有連結連向這些頁面。如果一篇獨特內容只出現在一個網址,網站上的連結就能集中到這一個網址,使其排名能力提高。連結分散到多個網址,會使得每一個網址排名能力都不突出。外部連結也同樣,很可能分散到不同URL。
同站複製也造成收錄過多沒有意義的頁面,在域名權重不高的情況下,可能擠佔了其他獨特內容的收錄機會。如果網站上存在大量複製內容,可能使搜尋引擎對網站質量產生懷疑,導致被懲罰。
3、消除複製內容
網址規範化問題造成的複製內容,前面已經討論過。最好的解決辦法是,確保一篇文章只對應一個URL,不要出現多個版本,網站所有內部連結統一連到這個URL。某些時候需要使用301重定向。
不是由於網址規範化造成的同站內複製內容,解決的最好方法是選取一個版本允許收錄,其他版本禁止搜尋引擎抓取或收錄。
既可以使用robots檔案禁止抓取,也可以使用noindex meta robots 標籤禁止索引。連向不希望收錄的複製內容的連結使用nofollow標籤,JavaScript等阻止蜘蛛爬行。
另一個解決複製內容的方法是使用 canonical 標籤。canonical 標籤既可以應用在網址規範化引起的複製內容上,也可以用在其他情況下。
比如網站上同一個款式的鞋子可能分為不同型號,型號之間唯一的區別只是顏色。這些型號生成多個網址,產品說明也幾乎完全一樣,只是說明顏色的地方不一樣。
這時就可以使用canonical 標籤,使用者不會被轉向,還是看到不同頁面,但搜尋引擎會把權重集中到其中一個型號上,從而避免複製內容。
帶有Session ID 的頁面也可以使用canonical 標籤,如頁面:http://www.yongfengseo.com/page-a.html 放上程式碼:
這樣,後面無論生成什麼 Session ID:
http://www.yongfengseo.com/page-a.html?sessionid=123456
http://www.yongfengseo.com/page-a.html?sessionid=456789
上面的URL都會被搜尋引擎把權重集中到:http://www.yongfengseo.com/page-a.html
不同網站之間複製內容解決起來就比較麻煩,因為其他網站上的內容是無法控制的。能夠做的只有兩點。一是在頁面中加入版權宣告,要求轉載的網站保留版權宣告及指向原出處的連結。
有些聚合網站會抓取feed自動生成內容,所以在feed中也要加入版權宣告和連結。
一般來說,原創版本的外部連結會比轉載多一些,就算在中文網際網路這個對版權極不重視的環境下,也還會有一些站長轉載時保留原出處連結。對搜尋引擎來說,指向原出處的連結是判斷原創的最重要訊號。
另一點就是堅持原創,假以時日必定能夠增加網站權重,使網站上內容被判斷為原創的機會增加。如果有其他網站大量抄襲,造成原創內容不能獲得排名,也可以考慮聯絡對方,要求加上版權連結或刪除抄襲內容,或者向對方主機、域名提供商投訴,向搜尋引擎投訴等。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28328249/viewspace-2726791/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- css+js 設定網頁內容不可複製或可複製CSSJS網頁
- 純CSS如何禁止使用者複製網頁的內容?CSS網頁
- 在Linux中,mysql 如何減少主從複製延遲?LinuxMySql
- 【Parasoft SOAtest】如何減少重複工作以加速功能測試程式
- js點選複製內容JS
- 如何解決unity做遊戲面臨的重複程式碼過多 程式碼複用性差的問題Unity遊戲
- 如何解決小網站內容管理問題網站
- excel怎麼篩選重複的內容 excel找出重複項並提取Excel
- 前端開發中減少重複勞動,提升效率的方法前端
- 網頁內容複製貼上(三種方案 相容多種瀏覽器)網頁瀏覽器
- JavaScript陣列刪除重複內容JavaScript陣列
- js 實現點選複製內容JS
- 目前國內最好用快速開發平臺,能幫助你減少90%的重複工作
- 如何解決MySQL主從複製太慢的問題MySql
- 網站文章內容修改 如何修改網站文章內容網站
- 資料檢視的重複問題
- 禁止複製的網頁怎麼複製網頁
- JS中的陣列複製問題JS陣列
- 公司網站如何更改內容公司網站如何更改內容資訊網站
- java繼承——對物件中的重複內容說ByeJava繼承物件
- Oracle 19C OGG基礎運維-07減少複製表Oracle運維
- Android studio glide包重複問題AndroidIDE
- Mac電腦自帶的Safari瀏覽器複製網頁內容教程Mac瀏覽器網頁
- 併發請求的重複插入問題
- 如何解決網站快照被劫持收錄灰色內容的問題網站
- 解決csdn登陸複製的問題
- JavaScript 深複製的迴圈引用問題JavaScript
- 淺複製和深複製的概念與值複製和指標複製(引用複製)有關 淺複製 “指標複製 深複製 值複製指標
- 批次複製資料夾而不復制內容
- MySQL 多源複製MySql
- vim沒有clipboard,沒法複製到系統剪下板,透過xclip將複製、刪除的內容放到系統剪下板
- webpack dll打包重複問題優化Web優化
- element UI元件樣式重複問題UI元件
- 解決關於Mac不能複製複製檔案到隨身碟的問題Mac
- python 如何一次隨機取出多條資料(能重複/不能重複)Python隨機
- 去除重複字母(不同字元的最小序列)問題字元
- 陣列(引用型別)複製問題陣列型別
- 解決移動端複製問題