Http協議具體解釋

weixin_30639719發表於2017-07-03

引言                                        

HTTP是一個屬於應用層的物件導向的協議。因為其簡捷、高速的方式。適用於分散式超媒體資訊系統。它於1990年提出。經過幾年的使用與發展。得到不斷地完好和擴充套件。眼下在WWW中使用的是HTTP/1.0的第六版,HTTP/1.1的規範化工作正在進行之中,並且HTTP-NG(Next Generation of HTTP)的建議已經提出。


HTTP協議的主要特點可概括例如以下:
1.支援客戶/server模式。


2.簡單高速:客戶向server請求服務時。僅僅需傳送請求方法和路徑。請求方法經常使用的有GET、HEAD、POST。每種方法規定了客戶與server聯絡的型別不同。

因為HTTP協議簡單,使得HTTPserver的程式規模小。因而通訊速度非常快。


3.靈活:HTTP同意傳輸隨意型別的資料物件。

正在傳輸的型別由Content-Type加以標記。
4.無連線:無連線的含義是限制每次連線僅僅處理一個請求。server處理完客戶的請求。並收到客戶的應答後。即斷開連線。

採用這樣的方式能夠節省傳輸時間。


5.無狀態:HTTP協議是無狀態協議。無狀態是指協議對於事務處理沒有記憶能力。

缺少狀態意味著假設興許處理須要前面的資訊,則它必須重傳,這樣可能導致每次連線傳送的資料量增大。還有一方面,在server不須要先前資訊時它的應答就較快。

 

一、HTTP協議具體解釋之URL篇

    http(超文字傳輸協議)是一個基於請求與響應模式的、無狀態的、應用層的協議,常基於TCP的連線方式,HTTP1.1版本號中給出一種持續連線的機制,絕大多數的Web開發。都是構建在HTTP協議之上的Web應用。

HTTP URL (URL是一種特殊型別的URI,包括了用於查詢某個資源的足夠的資訊)的格式例如以下:
http://host[":"port][abs_path]
http表示要通過HTTP協議來定位網路資源;host表示合法的Internet主機域名或者IP地址;port指定一個port號。為空則使用預設port80。abs_path指定請求資源的URI。假設URL中沒有給出abs_path,那麼當它作為請求URI時。必須以“/”的形式給出,通常這個工作瀏覽器自己主動幫我們完畢。
eg:
1、輸入:
www.guet.edu.cn
瀏覽器自己主動轉換成:http://www.guet.edu.cn/
2、http:192.168.0.116:8080/index.jsp 

 

二、HTTP協議具體解釋之請求篇

    http請求由三部分組成,各自是:請求行、訊息報頭、請求正文

1、請求行以一個方法符號開頭,以空格分開,後面跟著請求的URI和協議的版本號,格式例如以下:Method Request-URI HTTP-Version CRLF  
當中 Method表示請求方法;Request-URI是一個統一資源識別符號;HTTP-Version表示請求的HTTP協議版本號;CRLF表示回車和換行(除了作為結尾的CRLF外。不同意出現單獨的CR或LF字元)。

請求方法(全部方法全為大寫)有多種,各個方法的解釋例如以下:
GET     請求獲取Request-URI所標識的資源
POST    在Request-URI所標識的資源後附加新的資料
HEAD    請求獲取由Request-URI所標識的資源的響應訊息報頭
PUT     請求server儲存一個資源。並用Request-URI作為其標識
DELETE  請求server刪除Request-URI所標識的資源
TRACE   請求server回送收到的請求資訊。主要用於測試或診斷
CONNECT 保留將來使用
OPTIONS 請求查詢server的效能。或者查詢與資源相關的選項和需求
應用舉例:
GET方法:在瀏覽器的位址列中輸入網址的方式訪問網頁時,瀏覽器採用GET方法向server獲取資源,eg:GET /form.html HTTP/1.1 (CRLF)

POST方法要求被請求server接受附在請求後面的資料。經常使用於提交表單。


eg:POST /reg.jsp HTTP/ (CRLF)
Accept:image/gif,image/x-xbit,... (CRLF)
...
HOST:www.guet.edu.cn (CRLF)
Content-Length:22 (CRLF)
Connection:Keep-Alive (CRLF)
Cache-Control:no-cache (CRLF)
(CRLF)         //該CRLF表示訊息報頭已經結束。在此之前為訊息報頭
user=jeffrey&pwd=1234  //此行下面為提交的資料

HEAD方法與GET方法差點兒是一樣的,對於HEAD請求的回應部分來說。它的HTTP頭部中包括的資訊與通過GET請求所得到的資訊是同樣的。

利用這種方法,不必傳輸整個資源內容,就能夠得到Request-URI所標識的資源的資訊。該方法經常使用於測試超連結的有效性,能否夠訪問,以及近期是否更新。
2、請求報頭後述
3、請求正文(略) 

 

三、HTTP協議具體解釋之響應篇

    在接收和解釋請求訊息後,server返回一個HTTP響應訊息。

HTTP響應也是由三個部分組成,各自是:狀態行、訊息報頭、響應正文
1、狀態行格式例如以下:
HTTP-Version Status-Code Reason-Phrase CRLF
當中。HTTP-Version表示serverHTTP協議的版本號;Status-Code表示server發回的響應狀態程式碼。Reason-Phrase表示狀態程式碼的文字描寫敘述。


狀態程式碼有三位數字組成。第一個數字定義了響應的類別,且有五種可能取值:
1xx:指示資訊--表示請求已接收。繼續處理
2xx:成功--表示請求已被成功接收、理解、接受
3xx:重定向--要完畢請求必須進行更進一步的操作
4xx:client錯誤--請求有語法錯誤或請求無法實現
5xx:server端錯誤--server未能實現合法的請求
常見狀態程式碼、狀態描寫敘述、說明:
200 OK      //client請求成功
400 Bad Request  //client請求有語法錯誤。不能被server所理解
401 Unauthorized //請求未經授權,這個狀態程式碼必須和WWW-Authenticate報頭域一起使用 
403 Forbidden  //server收到請求,可是拒絕提供服務
404 Not Found  //請求資源不存在。eg:輸入了錯誤的URL
500 Internal Server Error //server發生不可預期的錯誤
503 Server Unavailable  //server當前不能處理client的請求。一段時間後可能恢復正常
eg:HTTP/1.1 200 OK (CRLF)

2、響應報頭後述

3、響應正文就是server返回的資源的內容 

 

四、HTTP協議具體解釋之訊息報頭篇

    HTTP訊息由client到server的請求和server到client的響應組成。

請求訊息和響應訊息都是由開始行(對於請求訊息,開始行就是請求行,對於響應訊息,開始行就是狀態行)。訊息報頭(可選)。空行(僅僅有CRLF的行)。訊息正文(可選)組成。

HTTP訊息報頭包含普通報頭、請求報頭、響應報頭、實體報頭。
每個報頭域都是由名字+“:”+空格+值 組成,訊息報頭域的名字是大寫和小寫無關的。

1、普通報頭
在普通報頭中。有少數報頭域用於全部的請求和響應訊息。但並不用於被傳輸的實體。僅僅用於傳輸的訊息。
eg:
Cache-Control   用於指定快取指令,快取指令是單向的(響應中出現的快取指令在請求中未必會出現)。且是獨立的(一個訊息的快取指令不會影響還有一個訊息處理的快取機制),HTTP1.0使用的類似的報頭域為Pragma。


請求時的快取指令包含:no-cache(用於指示請求或響應訊息不能快取)、no-store、max-age、max-stale、min-fresh、only-if-cached;
響應時的快取指令包含:public、private、no-cache、no-store、no-transform、must-revalidate、proxy-revalidate、max-age、s-maxage.
eg:為了指示IE瀏覽器(client)不要快取頁面,server端的JSP程式能夠編寫例如以下:response.sehHeader("Cache-Control","no-cache");
//response.setHeader("Pragma","no-cache");作用相當於上述程式碼,通常兩者//合用
這句程式碼將在傳送的響應訊息中設定普通報頭域:Cache-Control:no-cache


Date普通報頭域表示訊息產生的日期和時間

Connection普通報頭域同意傳送指定連線的選項。

比如指定連線是連續,或者指定“close”選項,通知server,在響應完畢後。關閉連線

2、請求報頭
請求報頭同意client向server端傳遞請求的附加資訊以及client自身的資訊。
經常使用的請求報頭
Accept
Accept請求報頭域用於指定client接受哪些型別的資訊。

eg:Accept:image/gif,表明client希望接受GIF圖象格式的資源;Accept:text/html,表明client希望接受html文字。


Accept-Charset
Accept-Charset請求報頭域用於指定client接受的字符集。eg:Accept-Charset:iso-8859-1,gb2312.假設在請求訊息中沒有設定這個域。預設是不論什麼字符集都能夠接受。
Accept-Encoding
Accept-Encoding請求報頭域類似於Accept。可是它是用於指定可接受的內容編碼。eg:Accept-Encoding:gzip.deflate.假設請求訊息中沒有設定這個域server假定client對各種內容編碼都能夠接受。
Accept-Language
Accept-Language請求報頭域類似於Accept,可是它是用於指定一種自然語言。

eg:Accept-Language:zh-cn.假設請求訊息中沒有設定這個報頭域,server假定client對各種語言都能夠接受。
Authorization
Authorization請求報頭域主要用於證明client有權檢視某個資源。當瀏覽器訪問一個頁面時,假設收到server的響應程式碼為401(未授權),能夠傳送一個包括Authorization請求報頭域的請求,要求server對其進行驗證。
Host(傳送請求時。該報頭域是必需的)
Host請求報頭域主要用於指定被請求資源的Internet主機和port號,它通常從HTTP URL中提取出來的,eg:
我們在瀏覽器中輸入:http://www.guet.edu.cn/index.html
瀏覽器傳送的請求訊息中。就會包括Host請求報頭域,例如以下:
Host:
www.guet.edu.cn
此處使用預設port號80,若指定了port號,則變成:Host:www.guet.edu.cn:指定port號
User-Agent
我們上網登陸論壇的時候。往往會看到一些歡迎資訊,當中列出了你的作業系統的名稱和版本號,你所使用的瀏覽器的名稱和版本號,這往往讓非常多人感到非常奇妙,實際上,server應用程式就是從User-Agent這個請求報頭域中獲取到這些資訊。

User-Agent請求報頭域同意client將它的作業系統、瀏覽器和其他屬性告訴server。

只是,這個報頭域沒必要的,假設我們自己編寫一個瀏覽器,不使用User-Agent請求報頭域,那麼server端就無法得知我們的資訊了。
請求報頭舉例:
GET /form.html HTTP/1.1 (CRLF)
Accept:image/gif,image/x-xbitmap,image/jpeg,application/x-shockwave-flash,application/vnd.ms-excel,application/vnd.ms-powerpoint,application/msword,*/* (CRLF)
Accept-Language:zh-cn (CRLF)
Accept-Encoding:gzip,deflate (CRLF)
If-Modified-Since:Wed,05 Jan 2007 11:21:25 GMT (CRLF)
If-None-Match:W/"80b1a4c018f3c41:8317" (CRLF)
User-Agent:Mozilla/4.0(compatible;MSIE6.0;Windows NT 5.0) (CRLF)
Host:www.guet.edu.cn (CRLF)
Connection:Keep-Alive (CRLF)
(CRLF)

3、響應報頭
響應報頭同意server傳遞不能放在狀態行中的附加響應資訊,以及關於server的資訊和對Request-URI所標識的資源進行下一步訪問的資訊。
經常使用的響應報頭
Location
Location響應報頭域用於重定向接受者到一個新的位置。

Location響應報頭域經常使用在更換域名的時候。
Server
Server響應報頭域包括了server用來處理請求的軟體資訊。與User-Agent請求報頭域是相相應的。

以下是
Server響應報頭域的一個樣例:
Server:Apache-Coyote/1.1
WWW-Authenticate
WWW-Authenticate響應報頭域必須被包括在401(未授權的)響應訊息中。client收到401響應訊息時候。併傳送Authorization報頭域請求server對其進行驗證時,服務端響應報頭就包括該報頭域。
eg:WWW-Authenticate:Basic realm="Basic Auth Test!"  //能夠看出server對請求資源採用的是基本驗證機制。


4、實體報頭
請求和響應訊息都能夠傳送一個實體。

一個實體由實體報頭域和實體正文組成。但並非說實體報頭域和實體正文要在一起傳送,能夠僅僅傳送實體報頭域。實體報頭定義了關於實體正文(eg:有無實體正文)和請求所標識的資源的元資訊。
經常使用的實體報頭
Content-Encoding
Content-Encoding實體報頭域被用作媒體型別的修飾符,它的值指示了已經被應用到實體正文的附加內容的編碼。因而要獲得Content-Type報頭域中所引用的媒體型別,必須採用對應的解碼機制。Content-Encoding這樣用於記錄文件的壓縮方法。eg:Content-Encoding:gzip
Content-Language
Content-Language實體報頭域描寫敘述了資源所用的自然語言。沒有設定該域則覺得實體內容將提供給全部的語言閱讀
者。eg:Content-Language:da
Content-Length
Content-Length實體報頭域用於指明實體正文的長度。以位元組方式儲存的十進位制數字來表示。
Content-Type
Content-Type實體報頭域用語指明傳送給接收者的實體正文的媒體型別。eg:
Content-Type:text/html;charset=ISO-8859-1
Content-Type:text/html;charset=GB2312
Last-Modified
Last-Modified實體報頭域用於指示資源的最後改動日期和時間。
Expires
Expires實體報頭域給出響應過期的日期和時間。為了讓代理server或瀏覽器在一段時間以後更新快取中(再次訪問曾訪問過的頁面時。直接從快取中載入,縮短響應時間和減少server負載)的頁面,我們能夠使用Expires實體報頭域指定頁面過期的時間。eg:Expires:Thu,15 Sep 2006 16:23:12 GMT
HTTP1.1的client和快取必須將其它非法的日期格式(包含0)看作已經過期。

eg:為了讓瀏覽器不要快取頁面,我們也能夠利用Expires實體報頭域,設定為0。jsp中程式例如以下:response.setDateHeader("Expires","0");

 

五、利用telnet觀察http協議的通訊過程

    實驗目的及原理:
    利用MS的telnet工具,通過手動輸入http請求資訊的方式,向server發出請求,server接收、解釋和接受請求後,會返回一個響應,該響應會在telnet窗體上顯示出來,從而從感性上加深對http協議的通訊過程的認識。

    實驗步驟:

1、開啟telnet
1.1 開啟telnet
執行-->cmd-->telnet

1.2 開啟telnet回顯功能
set localecho

2、連線server併傳送請求
2.1 open 
www.guet.edu.cn 80  //注意port號不能省略

    HEAD /index.asp HTTP/1.0
    Host:www.guet.edu.cn
    
   /*我們能夠變換請求方法,請求桂林電子主頁內容,輸入訊息例如以下*/
    open 
www.guet.edu.cn 80 
   
    GET /index.asp HTTP/1.0  //請求資源的內容
    Host:www.guet.edu.cn  

2.2 open www.sina.com.cn 80  //在命令提示符號下直接輸入telnet www.sina.com.cn 80
    HEAD /index.asp HTTP/1.0
    Host:www.sina.com.cn
 

3 實驗結果:

3.1 請求資訊2.1得到的響應是:

HTTP/1.1 200 OK                                              //請求成功
Server: Microsoft-IIS/5.0                                    //webserver
Date: Thu,08 Mar 200707:17:51 GMT
Connection: Keep-Alive                                 
Content-Length: 23330
Content-Type: text/html
Expries: Thu,08 Mar 2007 07:16:51 GMT
Set-Cookie: ASPSESSIONIDQAQBQQQB=BEJCDGKADEDJKLKKAJEOIMMH; path=/
Cache-control: private

//資源內容省略

3.2 請求資訊2.2得到的響應是:

HTTP/1.0 404 Not Found       //請求失敗
Date: Thu, 08 Mar 2007 07:50:50 GMT
Server: Apache/2.0.54 <Unix>
Last-Modified: Thu, 30 Nov 2006 11:35:41 GMT
ETag: "6277a-415-e7c76980"
Accept-Ranges: bytes
X-Powered-By: mod_xlayout_jh/0.0.1vhs.markII.remix
Vary: Accept-Encoding
Content-Type: text/html
X-Cache: MISS from zjm152-78.sina.com.cn
Via: 1.0 zjm152-78.sina.com.cn:80<squid/2.6.STABLES-20061207>
X-Cache: MISS from th-143.sina.com.cn
Connection: close


失去了跟主機的連線

按隨意鍵繼續...

4 .注意事項:1、出現輸入錯誤,則請求不會成功。
          2、報頭域不分大寫和小寫。


          3、更深一步瞭解HTTP協議,能夠檢視RFC2616,在http://www.letf.org/rfc上找到該檔案。


          4、開發後臺程式必須掌握http協議

六、HTTP協議相關技術補充

    1、基礎:
    高層協議有:檔案傳輸協議FTP、電子郵件傳輸協議SMTP、域名系統服務DNS、網路新聞傳輸協議NNTP和HTTP協議等
中介由三種:代理(Proxy)、閘道器(Gateway)和通道(Tunnel),一個代理依據URI的絕對格式來接受請求,重寫所有或部分訊息,通過 URI的標識把已格式化過的請求傳送到server。

閘道器是一個接收代理,作為一些其他server的上層,而且假設必須的話,能夠把請求翻譯給下層的server協議。一 個通道作為不改變訊息的兩個連線之間的中繼點。當通訊須要通過一箇中介(比如:防火牆等)或者是中介不能識別訊息的內容時。通道常常被使用。
     代理(Proxy):一箇中間程式,它能夠充當一個server,也能夠充當一個客戶機,為其他客戶機建立請求。

請求是通過可能的翻譯在內部或經過傳遞到其他的 server中。

一個代理在傳送請求資訊之前。必須解釋而且假設可能重寫它。代理常常作為通過防火牆的客戶機端的門戶,代理還能夠作為一個幫助應用來通過協議處 理沒有被使用者代理完畢的請求。


閘道器(Gateway):一個作為其他server中間媒介的server。與代理不同的是,閘道器接受請求就好象對被請求的資源來說它就是源server。發出請求的客戶機並沒有意識到它在同閘道器打交道。
閘道器常常作為通過防火牆的server端的門戶,閘道器還能夠作為一個協議翻譯器以便存取那些儲存在非HTTP系統中的資源。


    通道(Tunnel):是作為兩個連線中繼的中介程式。

一旦啟用,通道便被覺得不屬於HTTP通訊。雖然通道可能是被一個HTTP請求初始化的。

當被中繼 的連線兩端關閉時。通道便消失。當一個門戶(Portal)必須存在或中介(Intermediary)不能解釋中繼的通訊時通道被常常使用。



2、協議分析的優勢—HTTP分析器檢測網路攻擊
以模組化的方式對高層協議進行分析處理,將是未來入侵檢測的方向。


HTTP及其代理的經常使用埠80、3128和8080在network部分用port標籤進行了規定

3、HTTP協議Content Lenth限制漏洞導致拒絕服務攻擊
使用POST方法時。能夠設定ContentLenth來定義須要傳送的資料長度。比如ContentLenth:999999999。在傳送完畢前,內 存不會釋放,攻擊者能夠利用這個缺陷,連續向WEBserver傳送垃圾資料直至WEBserver記憶體耗盡。

這樣的攻擊方法基本不會留下痕跡。
http://www.cnpaf.net/Class/HTTP/0532918532667330.html

4、利用HTTP協議的特性進行拒絕服務攻擊的一些構思
server端忙於處理攻擊者偽造的TCP連線請求而無暇理睬客戶的正常請求(畢竟client的正常請求比率很之小),此時從正常客戶的角度看來。server失去響應,這樣的情況我們稱作:server端受到了SYNFlood攻擊(SYN洪水攻擊)。


而Smurf、TearDrop等是利用ICMP報文來Flood和IP碎片攻擊的。本文用“正常連線”的方法來產生拒絕服務攻擊。


19port在早期已經有人用來做Chargen攻擊了,即Chargen_Denial_of_Service,可是!他們用的方法是在兩臺Chargen server之間產生UDP連線,讓server處理過多資訊而DOWN掉。那麼,幹掉一臺WEBserver的條件就必須有2個:1.有Chargen服務2.有HTTP 服務
方法:攻擊者偽造源IP給N臺Chargen傳送連線請求(Connect),Chargen接收到連線後就會返回每秒72位元組的字元流(實際上依據網路實際情況,這個速度更快)給server。



5、Http指紋識別技術
   Http指紋識別的原理大致上也是同樣的:記錄不同server對Http協議執行中的微小區別進行識別.Http指紋識別比TCP/IP堆疊指紋識別複雜許 多,理由是定製Httpserver的配置檔案、新增外掛或元件使得更改Http的響應資訊變的非常easy,這樣使得識別變的困難;然而定製TCP/IP堆疊的行為 須要對核心層進行改動,所以就easy識別.
      要讓server返回不同的Banner資訊的設定是非常easy的,象Apache這種開放原始碼的Httpserver,使用者能夠在原始碼裡改動Banner資訊,然 後重起Http服務就生效了;對於沒有公開原始碼的Httpserver比方微軟的IIS或者是Netscape,能夠在存放Banner資訊的Dll檔案裡修 改,相關的文章有討論的,這裡不再贅述,當然這種改動的效果還是不錯的.第二種模糊Banner資訊的方法是使用外掛。


經常使用測試請求:
1:HEAD/Http/1.0傳送主要的Http請求
2:DELETE/Http/1.0傳送那些不被同意的請求,比方Delete請求
3:GET/Http/3.0傳送一個非法版本號的Http協議請求
4:GET/JUNK/1.0傳送一個不對規格的Http協議請求
Http指紋識別工具Httprint,它通過運用統計學原理,組合模糊的邏輯學技術,能非常有效的確定Httpserver的型別.它能夠被用來收集和分析不同Httpserver產生的簽名。



6、其它:為了提高使用者使用瀏覽器時的效能。現代瀏覽器還支援併發的訪問方式。瀏覽一個網頁時同一時候建立多個連線,以迅速獲得一個網頁上的多個圖示,這樣能更高速完畢整個網頁的傳輸。
HTTP1.1中提供了這樣的持續連線的方式,而下一代HTTP協議:HTTP-NG更新增了有關會話控制、豐富的內內容協商以及其他形式的支援,提供
更高效的連線。

版權宣告:本文部落格原創文章,部落格,未經同意,不得轉載。

轉載於:https://www.cnblogs.com/yxwkf/p/4726072.html

相關文章