織夢有哪些檔案需要設定robot的Disallow呢?

zzhuaze發表於2022-03-23

用織夢DEDECMS建站的站長會發現,DEDECMS自帶的robots.txt檔案設定很簡單(開發者基於每個網站的目錄結構和最佳化目的不同的考慮),並不能完全滿足網站的最佳化要求,那怎樣才能結合自己網站的情況,做好robots.txt最佳化呢?以下介紹一點自己的想法,僅供參考。

適用於未偽靜態的DEDECMS網站。

User-agent: *

Disallow: /dede 管理後臺目錄,需要改名,具體設定後面具體講

Disallow: /include 程式核心檔案目錄

Disallow: /member 會員管理目錄,有些檔案可以開放

Disallow: /plus 外掛及輔助功能目錄 ,有些檔案可以開放,如search.php

Disallow: /templets 預設模板存放目錄

Disallow: /data 系統快取或其它可寫入資料存放目錄

Disallow: /uploads 上傳下載檔案儲存目錄,不想搜尋引擎引用圖片的話,禁止

Disallow: /images 系統預設模板圖片存放目錄

Disallow: /index.php 網站預設首頁,靜態化的話,最好禁止

Disallow: /404.html

Allow: /plus/search.php 開放禁止目錄裡的具體檔案

...

基本設定就是這樣,下面著重講下後臺管理目錄和欄目頁的設定:

1.dede目錄,為了網站安全考慮需要改名。然而改名之後,大家不免疑惑:改了名,在robots.txt檔案裡怎麼設定呢?直接禁止抓取,還是洩露了後臺目錄,等於改名無效。那麼該如何解決這個問題呢?我們可以透過下面的設定解決這個問題,如後臺目錄為dedecms:

Disallow: /d*ms

這樣我們就能即禁止了搜尋引擎的抓取,又不會洩露了後臺目錄名稱。

2.欄目頁。有些人會注意到,如果網站不做偽靜態最佳化的話,欄目分頁後會有兩個連結指向欄目首頁,如*/web/和*/web/list_1_1.html,為了網站最佳化,建議先將欄目分頁最佳化以下(具體做法大家可以在網上找),把首頁和第一頁的連結改為*/web/的形式,然後在robots.txt檔案裡做以下設定:

Disallow: /*1.html$

以上就是DEDECMS robots.txt檔案的設定,大家可以根據自己網站的情況具體設定。

注意事項:

1.按官方說明設定好目錄許可權;

2.後臺目錄改後的名稱開頭字母和結尾字母不要和其他目錄一樣;

3.用百度站長工具測試一下robots.txt檔案設定是否有效。 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70015609/viewspace-2883534/,如需轉載,請註明出處,否則將追究法律責任。

相關文章