超詳細robots.txt大全和禁止目錄收錄及指定頁面

葉濤VXyetaoaiueo-專注網際網路發表於2020-04-06

原文網址 : https://blog.csdn.net/yetaodiao/article/details/80900133

robots.txt寫法大全和robots.txt語法的作用
1如果允許所有搜尋引擎訪問網站的所有部分的話我們可以建立一個空白的文字文件，命名為robots.txt放在網站的根目錄下即可。
robots.txt寫法如下：
User-agent: *
Disallow:
或者
User-agent: *
Allow: /
2如果我們禁止所有搜尋引擎訪問網站的所有部分的話
robots.txt寫法如下：
User-agent: *
Disallow: /
3如果我們需要某一個搜尋引擎的抓取的話，比如百度，禁止百度索引我們的網站的話
robots.txt寫法如下：
User-agent: Baiduspider
Disallow: /
4如果我們禁止Google索引我們的網站的話，其實跟示例3一樣，就是User-agent:標頭檔案的蜘蛛名字改成谷歌的Googlebot
即可
robots.txt寫法如下：
User-agent: Googlebot
Disallow: /
5如果我們禁止除Google外的一切搜尋引擎索引我們的網站話
robots.txt寫法如下：
User-agent: Googlebot
Disallow:
User-agent: *
Disallow: /
6如果我們禁止除百度外的一切搜尋引擎索引我們的網站的話
robots.txt寫法如下：
User-agent: Baiduspider
Disallow:
User-agent: *
Disallow: /
7如果我們需要禁止蜘蛛訪問某個目錄，比如禁止admin、css、images等目錄被索引的話
robots.txt寫法如下：
User-agent: *
Disallow: /css/
Disallow: /admin/
Disallow: /images/
8如果我們允許蜘蛛訪問我們網站的某個目錄中的某些特定網址的話
robots.txt寫法如下：
User-agent: *
Allow: /css/my
Allow: /admin/html
Allow: /images/index
Disallow: /css/
Disallow: /admin/
Disallow: /images/
9我們看某些網站的robots.txt裡的Disallow或者Allow裡會看很多的符號，比如問號星號什麼的，如果使用“*”，主要是限制訪問某個字尾的域名，禁止訪問/html/目錄下的所有以”.htm”為字尾的URL(包含子目錄)。
robots.txt寫法如下：
User-agent: *
Disallow: /html/*.htm
10如果我們使用“$”的話是僅允許訪問某目錄下某個字尾的檔案
robots.txt寫法如下：
User-agent: *
Allow: .asp$
Disallow: /

11如果我們禁止索引網站中所有的動態頁面（這裡限制的是有“?”的域名，例如index.asp?id=1）
robots.txt寫法如下：
User-agent: *
Disallow: /*?*
有些時候，我們為了節省伺服器資源，需要禁止各類搜尋引擎來索引我們網站上的圖片，這裡的辦法除了使用“Disallow: /images/”這樣的直接遮蔽資料夾的方式之外，還可以採取直接遮蔽圖片字尾名的方式。
示例12
如果我們禁止Google搜尋引擎抓取我們網站上的所有圖片(如果你的網站使用其他字尾的圖片名稱，在這裡也可以直接新增)
robots.txt寫法如下：
User-agent: Googlebot
Disallow: .jpg$
Disallow: .jpeg$
Disallow: .gif$
Disallow: .png$
Disallow: .bmp$
13如果我們禁止百度搜尋引擎抓取我們網站上的所有圖片的話
robots.txt寫法如下：
User-agent: Baiduspider
Disallow: .jpg$
Disallow: .jpeg$
Disallow: .gif$
Disallow: .png$
Disallow: .bmp$
14除了百度之外和Google之外，禁止其他搜尋引擎抓取你網站的圖片
(注意，在這裡為了讓各位看的更明白，因此使用一個比較笨的辦法——對於單個搜尋引擎單獨定義。)
robots.txt寫法如下：
User-agent: Baiduspider
Allow: .jpeg$
Allow: .gif$
Allow: .png$
Allow: .bmp$
User-agent: Googlebot
Allow: .jpeg$
Allow: .gif$
Allow: .png$
Allow: .bmp$
User-agent: *
Disallow: .jpg$
Disallow: .jpeg$
Disallow: .gif$
Disallow: .png$
Disallow: .bmp$

15僅僅允許百度抓取網站上的“JPG”格式檔案
（其他搜尋引擎的辦法也和這個一樣，只是修改一下搜尋引擎的蜘蛛名稱即可）
robots.txt寫法如下：
User-agent: Baiduspider
Allow: .jpg$
Disallow: .jpeg$
Disallow: .gif$
Disallow: .png$
Disallow: .bmp$
16僅僅禁止百度抓取網站上的“JPG”格式檔案
robots.txt寫法如下：
User-agent: Baiduspider
Disallow: .jpg$
17如果 ? 表示一個會話 ID，您可排除所有包含該 ID 的網址，確保 Googlebot 不會抓取重複的網頁。但是，以 ? 結尾的網址可能是您要包含的網頁版本。在此情況下，沃恩可將與 Allow 指令配合使用。
robots.txt寫法如下：
User-agent:*
Allow:/*?$
Disallow:/*?
Disallow:/ *?
一行將攔截包含 ? 的網址（具體而言，它將攔截所有以您的域名開頭、後接任意字串，然後是問號 (?)，而後又是任意字串的網址）。Allow: /*?$ 一行將允許包含任何以 ? 結尾的網址（具體而言，它將允許包含所有以您的域名開頭、後接任意字串，然後是問號 (?)，問號之後沒有任何字元的網址）。

18如果我們想禁止搜尋引擎對一些目錄或者某些URL訪問的話，可以擷取部分的名字
robots.txt寫法如下：
User-agent:*
Disallow: /plus/feedback.php?
以上內容供大家參考下即可。

Linux 目錄結構及詳細操作
2021-12-13
Linux
【ZIP】打包過濾指定目錄和檔案
2018-12-02
Vue 指令大全（超詳細）
2019-12-17
Vue
8.var目錄下的檔案和目錄詳解
2020-04-04
對於C#winform介面開發中開啟指定的目錄及開啟指定目錄下的檔案
2018-08-31
C#ORM
git clone到指定的目錄
2018-03-09
Git
git切換到指定目錄
2018-03-31
Git
vue-cli 目錄結構詳細講解
2019-02-16
Vue
windows 把指定目錄的檔案複製到當前目錄
2024-08-06
Windows
[轉帖]linux的tmpfs和/dev/shm目錄的詳細介紹
2024-05-21
Linuxdev
git下載倉庫指定目錄
2018-12-10
Git
Linux 目錄詳解
2020-05-22
Linux
linux目錄詳解
2020-12-15
Linux
超詳細講解頁面載入過程
2021-11-09
啟動filezilla後自動連線指定站點及進入指定的目錄
2024-03-29
刪除指定目錄下指定字尾的檔案
2018-07-29
微力開啟頁面空白，不顯示目錄
2024-07-25
tar命令打包指定目錄及其檔案，而不包括其上級目錄
2024-08-22
nginx二級目錄代理minio指定桶
2024-11-08
Nginx
AndroidSDK的目錄詳解
2019-08-06
Android
win10 cmd跳到指定目錄怎麼操作_win10系統cmd如何切換到指定目錄
2020-04-21
Win10
Android面試題收錄及解答10月刊
2020-10-26
Android面試題
elasticsearch: 指定索引資料的儲存目錄
2024-08-08
Elasticsearch索引
使用thin jar啟動並指定lib目錄
2024-08-04
JAR
Windows實現桌面錄屏、指定視窗錄製直播，低延時，H5頁面播放
2022-01-05
WindowsH5
windows下啟動cmd，開啟指定目錄，執行指定命令
2018-11-27
Windows
Java 從指定URL下載檔案並儲存到指定目錄
2018-05-31
Java
springboot常用註解大全(超詳細, 30個)
2024-07-15
Spring Boot
windows臨時目錄詳解
2022-11-05
Windows
Linux之旅第一篇-目錄結構及操作目錄
2019-05-26
Linux
【Mysql】InnoDB 引擎中的頁目錄
2021-07-24
MySql
2.3 sqlmap目錄及結構
2020-06-07
SQL
Linux檔案及目錄管理
2020-08-05
Linux
Linux之普通使用者ssh到指定目錄
2024-05-27
Linux
用批處理在指定目錄啟動Notebook
2024-11-28
Linux解壓檔案到指定目錄的方法
2021-02-13
Linux
怎麼檢視網站是否被谷歌收錄，檢視網站是否被谷歌收錄的詳細步驟
2024-10-02
網站谷歌
Android中讀取assets目錄下的檔案詳細介紹
2018-10-30
Android

超詳細robots.txt大全和禁止目錄收錄及指定頁面

相關文章