urlparse模組(python模組)

科技小能手發表於2017-11-12

一、urlparse模組簡介

    urlparse模組主要是把url拆分為6部分,並返回元組。並且可以把拆分後的部分再組成一個url。主要有函式有urljoin、urlsplit、urlunsplit、urlparse等。


二、urljoin函式使用

    urljoin主要是拼接URL,它以base作為其基地址,然後與url中的相對地址相結合組成一個絕對URL地址。函式urljoin在通過為URL基地址附加新的檔名的方式來處理同一位置處的若干檔案的時候格外有用。需要注意的是,如果基地址並非以字元/結尾的話,那麼URL基地址最右邊部分就會被這個相對路徑所替換。如果希望在該路徑中保留末端目錄,應確保URL基地址以字元/結尾。

輸入程式碼:

import urlparse

#urljoin函式是合併域名和相對路徑的
urljoin = urlparse.urljoin(`http://www.sina.cn/cc`,`file/down.php`)
print urljoin

urljoin1 = urlparse.urljoin(`http://www.sina.cn/cc/`,`file/down.php`)
print urljoin1



程式碼執行結果:

C:Python27python.exe C:/Users/Lee/Desktop/d/PycharmProjects/untitled/test.py

http://www.sina.cn/file/down.php

http://www.sina.cn/cc/file/down.php


三、urlparse函式和urlsplit函式使用

    主要是分析urlstring,返回一個包含5個字串專案的元組:協議、位置、路徑、查詢、片段。allow_fragments為False時,該元組的組後一個專案總是空,不管urlstring有沒有片段,省略專案的也是空。urlsplit()和urlparse()差不多

輸入程式碼:

import urlparse

url = `http://www.baidu.com/good/index.php?id=18`

#urlsplit函式是把一個url查分出對應部分
result = urlparse.urlsplit(url)
print result
#顯示協議
print result.scheme
#顯示域名
print result.netloc
#顯示相對路徑
print result.path
#顯示查詢引數
print result.query



程式碼執行結果:

C:Python27python.exe C:/Users/Lee/Desktop/d/PycharmProjects/untitled/test.py

SplitResult(scheme=`http`, netloc=`www.baidu.com`, path=`/good/index.php`, query=`id=18`, fragment=“)

http

www.baidu.com

/good/index.php

id=18


本文轉自 老鷹a  51CTO部落格,原文連結:http://blog.51cto.com/laoyinga/1978073


相關文章