爬蟲第一章 資料提取與清洗策略

來時春盡發表於2020-11-10

第一章 資料提取與清洗策略

正規表示式

2.案例:定義密碼的正規表示式

re模組使用案例

1.提取

import re
ret = re.findall(【正規表示式】,【被提取的字串】)
注:
匹配成功返回列表
匹配不成功返回空列表

2.匹配

import re
ret = re.match(【正規表示式】,【被提取的字串】)
注:
匹配成功返回物件
匹配不成功返回None

3.替換

import re
ret = re.sub(【正規表示式】,【替換成的字串】,【被匹配的字串】)
注:
匹配成功返回物件
匹配不成功返回None

4.演示

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>Title</title>
</head>
<body>
    <footer>
        <div>
            <div class="email">
                Email:kefu@CSDN.net
            </div>
            <div class="tel">
                手機號:400-660-0108
            </div>
        </div>
    </footer>
</body>
</html>

相關文章