pyqt5 eric6 教程(二)實戰:百度圖片下載器

weixin_33785972發表於2017-05-05

我們來寫一個簡單的百度圖片下載器,過程如下:
1.百度圖片爬蟲
2.eric6 和 qt designer 設計 GUI介面
3.將桌面程式和爬蟲程式整合在一起
4.打包程式

一、百度圖片下載爬蟲

這個在爬蟲文集裡有,實現原理請戳這 爬百度圖片
由於我們們是要整合到 GUI 程式裡,所以這裡將它寫為一個類:

import requests
import urllib
import os, re
import itertools


class Spider(object):

    def __init__(self, keyword):
        self.keyword = keyword
        self.urls = self.buildUrls()
        self.sign_table = {              
    '_z2C$q': ':',
    '_z&e3B': '.',
    'AzdH3F': '/'
}
        self.char_table = {              
    'w': 'a',
    'k': 'b',
    'v': 'c',
    '1': 'd',
    'j': 'e',
    'u': 'f',
    '2': 'g',
    'i': 'h',
    't': 'i',
    '3': 'j',
    'h': 'k',
    's': 'l',
    '4': 'm',
    'g': 'n',
    '5': 'o',
    'r': 'p',
    'q': 'q',
    '6': 'r',
    'f': 's',
    'p': 't',
    '7': 'u',
    'e': 'v',
    'o': 'w',
    '8': '1',
    'd': '2',
    'n': '3',
    '9': '4',
    'c': '5',
    'm': '6',
    '0': '7',
    'b': '8',
    'l': '9',
    'a': '0'
}
        self.char_table = {ord(key): ord(value) for key, value in self.char_table.items()}

    def decode(self, url):
        for key, value in self.sign_table.items():
            url = url.replace(key, value)
        return url.translate(self.char_table)

    def buildUrls(self):
        word = urllib.parse.quote(self.keyword)
        url = r"http://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&fp=result&queryWord={word}&cl=2&lm=-1&ie=utf-8&oe=utf-8&st=-1&ic=0&word={word}&face=0&istype=2nc=1&pn={pn}&rn=60"
        urls = (url.format(word=word, pn=x) for x in itertools.count(start=0, step=60))
        return urls

    def resolveImgUrl(self, html):
        re_url = re.compile(r'"objURL":"(.*?)"')
        imgUrls = [self.decode(x) for x in re_url.findall(html)]
        return imgUrls

    def downImg(self, imgUrl, dirpath, imgName):
        filename = os.path.join(dirpath, imgName)
        try:
            res = requests.get(imgUrl, timeout=15)
            if str(res.status_code)[0] == "4":
                print(str(res.status_code), ":" , imgUrl)
                return False
        except Exception as e:
            print("丟擲異常:", imgUrl)
            print(e)
            return False
        with open(filename, "wb") as f:
            f.write(res.content)
        return True

    def get_path(self):
        dirpath = os.getcwd() + '\\pictures'
        if not os.path.isdir(dirpath):
            os.mkdir(dirpath)
        return dirpath

    def Download(self):
        dirpath = self.get_path()
        index = 0
        for url in self.urls:
            html = requests.get(url, timeout=10).content.decode('utf-8')
            imgUrls = self.resolveImgUrl(html)
            if len(imgUrls) == 0:
                break
            for url in imgUrls:
                if self.downImg(url, dirpath, str(index) + ".jpg"):
                    index += 1
                    print("已下載 %s 張" % index)
        return index

if __name__ == "__main__":

    a = Spider("美女")
    a.Download()

執行該檔案將把圖片下載該目錄下的 picture 資料夾內。
命名為 BaiduSpider.py,先儲存下來。

二、接著來設計 GUI 介面

開啟 eric6,新建下專案,具體過程見教程(一)裡面的連結文章


2040490-637fc84897338aa7.png

點選窗體,在空白處右鍵新建個窗體,就命名為 window吧


2040490-2e3d74b9ebd2fd92.png

可以看到視窗裡生成了 window.ui 檔案
2040490-8697546a92dfa1dd.png

並且自動跳入 qt designer

2040490-4100d1e8ae47a4cf.png

先實現最基本的介面,新增倆個 label,文字改為“請輸入關鍵詞” 和“————”, 在右上角新增一個lineEdit, 還有倆個 pushbutton 文字改為“開始下載” 和 “退出”。
給退出按鈕加上訊號槽。

2040490-8ca2ab1958da3427.png

點選 ok ,可以看到退出的動作訊號已經好了


2040490-5e1fcde06cc4a0a6.png

儲存下檔案(工具欄第三個按鈕),關閉qt designer 回到 eric6
右鍵我們剛儲存的 window.ui 檔案,選擇編譯視窗,提示編譯成功,回到原始碼欄,多出了個UI_windows.py檔案


2040490-5765a8f0d0e6f94b.png

右鍵該檔案,開啟,在開始中選執行指令碼,發現我們剛設計的 GUI 視窗出現了,點選退出,視窗關閉
2040490-a1ade36da8aa5f10.png

那麼我們一個簡單的 GUI 設計到此算完成了

三、整合

關閉 eric6, 複製下UI_windows.py檔案,改名為 main.py,以及把第一步的 BaiduSpider.py 也放在這個資料夾


2040490-65311cca4a2bd4e7.png

接著編輯 main.py,先開啟

# -*- coding: utf-8 -*-

# Form implementation generated from reading ui file 'E:\Python專案\Pyqt\eric\百度圖片下載器\window.ui'
#
# Created by: PyQt5 UI code generator 5.6
#
# WARNING! All changes made in this file will be lost!

from PyQt5 import QtCore, QtGui, QtWidgets

class Ui_Dialog(object):
    def setupUi(self, Dialog):
        Dialog.setObjectName("Dialog")
        Dialog.resize(527, 351)
        Dialog.setSizeGripEnabled(True)
        self.label = QtWidgets.QLabel(Dialog)
        self.label.setGeometry(QtCore.QRect(70, 70, 101, 16))
        self.label.setObjectName("label")
        self.lineEdit = QtWidgets.QLineEdit(Dialog)
        self.lineEdit.setGeometry(QtCore.QRect(232, 70, 141, 21))
        self.lineEdit.setObjectName("lineEdit")
        self.label_2 = QtWidgets.QLabel(Dialog)
        self.label_2.setGeometry(QtCore.QRect(60, 170, 161, 31))
        self.label_2.setObjectName("label_2")
        self.pushButton = QtWidgets.QPushButton(Dialog)
        self.pushButton.setGeometry(QtCore.QRect(270, 180, 93, 28))
        self.pushButton.setObjectName("pushButton")
        self.pushButton_2 = QtWidgets.QPushButton(Dialog)
        self.pushButton_2.setGeometry(QtCore.QRect(350, 290, 93, 28))
        self.pushButton_2.setObjectName("pushButton_2")

        self.retranslateUi(Dialog)
        self.pushButton_2.clicked.connect(Dialog.close)
        QtCore.QMetaObject.connectSlotsByName(Dialog)

    def retranslateUi(self, Dialog):
        _translate = QtCore.QCoreApplication.translate
        Dialog.setWindowTitle(_translate("Dialog", "百度圖片下載器"))
        self.label.setText(_translate("Dialog", "請輸入關鍵詞:"))
        self.label_2.setText(_translate("Dialog", "________________"))
        self.pushButton.setText(_translate("Dialog", "開始下載"))
        self.pushButton_2.setText(_translate("Dialog", "退出"))


if __name__ == "__main__":
    import sys
    app = QtWidgets.QApplication(sys.argv)
    Dialog = QtWidgets.QDialog()
    ui = Ui_Dialog()
    ui.setupUi(Dialog)
    Dialog.show()
    sys.exit(app.exec_())

先把開頭的註釋刪掉,然後分析下程式碼
setupUI 這個方法主要是建立我們的 GUI 佈局,retranslateUi 方法則設定了一些文字內容,(由於在設計 GUI 的時候我並沒有對每個元素進行相應的命名,剛好可以從這看出元素的名字)
先設定 lineEdit, 在使用者輸入什麼內容時,將內容傳送到label_2。

self.lineEdit.textChanged[str].connect(self.onChanged)

在 setupUI方法裡關於 lineEdit 新增上面程式碼,並新增 onChanged 方法。

    def onChanged(self, text):
        self.label_2.setText(text)
        self.label_2.adjustSize()
        self.keyword = text

如果 lineEdit的內容發生了改變,即使用者輸入了內容,就會將內容傳送到 label_2 並調整大小。然後建立私有變數 self.keyword(後面百度圖片下載要傳入的關鍵詞)
在使用者輸入內容後,點選開始下載則下載圖片,所以在 setupUI 里加上

self.pushButton.clicked.connect(self.Download)

新增 Download方法

    def Download(self.setText("正在下載")
        a = BaiduSpider.Spider(self.keyword)
        a.Download()

當點選開始下載後,則將按鈕文字改為“正在下載”,建立 BaiduSpider 例項,傳入關鍵詞,然後開始下載圖片。記得在帶面前面 匯入BaiduSpider。即

import BaiduSpider

改完程式碼如下:


from PyQt5 import QtCore, QtGui, QtWidgets
import BaiduSpider

class Ui_Dialog(object):
    def setupUi(self, Dialog):
        Dialog.setObjectName("Dialog")
        Dialog.resize(527, 351)
        Dialog.setSizeGripEnabled(True)
        self.label = QtWidgets.QLabel(Dialog)
        self.label.setGeometry(QtCore.QRect(70, 70, 101, 16))
        self.label.setObjectName("label")
        self.lineEdit = QtWidgets.QLineEdit(Dialog)
        self.lineEdit.setGeometry(QtCore.QRect(232, 70, 141, 21))
        self.lineEdit.setObjectName("lineEdit")
        self.lineEdit.textChanged[str].connect(self.onChanged)
        self.label_2 = QtWidgets.QLabel(Dialog)
        self.label_2.setGeometry(QtCore.QRect(60, 170, 161, 31))
        self.label_2.setObjectName("label_2")
        self.pushButton = QtWidgets.QPushButton(Dialog)
        self.pushButton.setGeometry(QtCore.QRect(270, 180, 93, 28))
        self.pushButton.setObjectName("pushButton")
        self.pushButton_2 = QtWidgets.QPushButton(Dialog)
        self.pushButton_2.setGeometry(QtCore.QRect(350, 290, 93, 28))
        self.pushButton_2.setObjectName("pushButton_2")

        self.retranslateUi(Dialog)
        self.pushButton_2.clicked.connect(Dialog.close)
        QtCore.QMetaObject.connectSlotsByName(Dialog)
        self.pushButton.clicked.connect(self.Download)

    def retranslateUi(self, Dialog):
        _translate = QtCore.QCoreApplication.translate
        Dialog.setWindowTitle(_translate("Dialog", "百度圖片下載器"))
        self.label.setText(_translate("Dialog", "請輸入關鍵詞:"))
        self.label_2.setText(_translate("Dialog", "________________"))
        self.pushButton.setText(_translate("Dialog", "開始下載"))
        self.pushButton_2.setText(_translate("Dialog", "退出"))


    def onChanged(self, text):
        self.label_2.setText(text)
        self.label_2.adjustSize()
        self.keyword = text

    def Download(self):
        self.pushButton.setText("正在下載")
        a = BaiduSpider.Spider(self.keyword)
        a.Download()


if __name__ == "__main__":
    import sys
    app = QtWidgets.QApplication(sys.argv)
    Dialog = QtWidgets.QDialog()
    ui = Ui_Dialog()
    ui.setupUi(Dialog)
    Dialog.show()
    sys.exit(app.exec_())

執行看看

2040490-2d5f0f3d0ee412fa.png
2040490-2fac33ab900cca7f.png

發現有個意外,就是下載時程式就不能被選中了,再點選就會卡死。應該是執行緒中通訊的問題,這個先忽略下。

四、解決阻塞

在上面的程式中,當我們開始下載圖片時,由於該下載任務時長較久,就會阻塞程式,詳情見這篇文章[http://www.jianshu.com/p/ed47a8959854]
(pyqt多程式防阻塞)
按照這樣我們來修改下程式碼
先匯入 QTthread

from PyQt5.QtCore import *

再修改下面這些


2040490-e7904d70a119e28e.png

from PyQt5 import QtCore, QtGui, QtWidgets
import BaiduSpider
from PyQt5.QtCore import *

class Ui_Dialog(object):
    def setupUi(self, Dialog):
        Dialog.setObjectName("Dialog")
        Dialog.resize(527, 351)
        Dialog.setSizeGripEnabled(True)
        self.label = QtWidgets.QLabel(Dialog)
        self.label.setGeometry(QtCore.QRect(70, 70, 101, 16))
        self.label.setObjectName("label")
        self.lineEdit = QtWidgets.QLineEdit(Dialog)
        self.lineEdit.setGeometry(QtCore.QRect(232, 70, 141, 21))
        self.lineEdit.setObjectName("lineEdit")
        self.lineEdit.textChanged[str].connect(self.onChanged)
        self.label_2 = QtWidgets.QLabel(Dialog)
        self.label_2.setGeometry(QtCore.QRect(60, 170, 161, 31))
        self.label_2.setObjectName("label_2")
        self.pushButton = QtWidgets.QPushButton(Dialog)
        self.pushButton.setGeometry(QtCore.QRect(270, 180, 93, 28))
        self.pushButton.setObjectName("pushButton")
        self.pushButton_2 = QtWidgets.QPushButton(Dialog)
        self.pushButton_2.setGeometry(QtCore.QRect(350, 290, 93, 28))
        self.pushButton_2.setObjectName("pushButton_2")

        self.retranslateUi(Dialog)
        self.pushButton_2.clicked.connect(Dialog.close)
        QtCore.QMetaObject.connectSlotsByName(Dialog)
        self.pushButton.clicked.connect(self.Download)

    def retranslateUi(self, Dialog):
        _translate = QtCore.QCoreApplication.translate
        Dialog.setWindowTitle(_translate("Dialog", "百度圖片下載器"))
        self.label.setText(_translate("Dialog", "請輸入關鍵詞:"))
        self.label_2.setText(_translate("Dialog", "________________"))
        self.pushButton.setText(_translate("Dialog", "開始下載"))
        self.pushButton_2.setText(_translate("Dialog", "退出"))


    def onChanged(self, text):
        self.label_2.setText(text)
        self.label_2.adjustSize()
        self.keyword = text

    def Download(self):
        self.pushButton.setText("正在下載")
        self.thread = RunThread(self.keyword)
        self.thread.start()

class RunThread(QThread):

    trigger = pyqtSignal()
 
    def __init__(self,keyword):
        super(RunThread, self).__init__()
        self.key = keyword

    def run(self):
        
        a = BaiduSpider.Spider(self.key)
        a.Download()
        self.trigger.emit()


if __name__ == "__main__":
    import sys
    app = QtWidgets.QApplication(sys.argv)
    Dialog = QtWidgets.QDialog()
    ui = Ui_Dialog()
    ui.setupUi(Dialog)
    Dialog.show()
    sys.exit(app.exec_())

執行下,發現問題已經解決,但圖片下載速度好像有點慢

2040490-3eadf0a2ad02e986.png

這時我們可以把百度圖片爬蟲換成多執行緒的,在上文的文章裡有多執行緒版本,這裡就不重複了,同樣改成一個類就行。

五、打包程式

用 pyinstaller 就行了,用pip下載完
在該目錄下按住 shift 右鍵開啟選擇在此開啟命令列,輸入

pyinstaller -F main.py

過一會兒檔案就打包完成了,在 dist 目錄下可以發現有個 main.exe檔案,挺大的。這個檔案可以單獨執行了,開啟,等一會兒就會跳出我們的 GUI介面,然後就可以下載圖片了。
雖然挺簡陋的,但起碼也是不錯的哈

相關文章