pyqt5 eric6 教程（二）實戰：百度圖片下載器

weixin_33785972發表於2017-05-05

我們來寫一個簡單的百度圖片下載器，過程如下：
1.百度圖片爬蟲
2.eric6 和 qt designer 設計 GUI介面
3.將桌面程式和爬蟲程式整合在一起
4.打包程式

一、百度圖片下載爬蟲

這個在爬蟲文集裡有，實現原理請戳這爬百度圖片
由於我們們是要整合到 GUI 程式裡，所以這裡將它寫為一個類：

import requests
import urllib
import os, re
import itertools


class Spider(object):

    def __init__(self, keyword):
        self.keyword = keyword
        self.urls = self.buildUrls()
        self.sign_table = {              
    '_z2C$q': ':',
    '_z&e3B': '.',
    'AzdH3F': '/'
}
        self.char_table = {              
    'w': 'a',
    'k': 'b',
    'v': 'c',
    '1': 'd',
    'j': 'e',
    'u': 'f',
    '2': 'g',
    'i': 'h',
    't': 'i',
    '3': 'j',
    'h': 'k',
    's': 'l',
    '4': 'm',
    'g': 'n',
    '5': 'o',
    'r': 'p',
    'q': 'q',
    '6': 'r',
    'f': 's',
    'p': 't',
    '7': 'u',
    'e': 'v',
    'o': 'w',
    '8': '1',
    'd': '2',
    'n': '3',
    '9': '4',
    'c': '5',
    'm': '6',
    '0': '7',
    'b': '8',
    'l': '9',
    'a': '0'
}
        self.char_table = {ord(key): ord(value) for key, value in self.char_table.items()}

    def decode(self, url):
        for key, value in self.sign_table.items():
            url = url.replace(key, value)
        return url.translate(self.char_table)

    def buildUrls(self):
        word = urllib.parse.quote(self.keyword)
        url = r"http://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&fp=result&queryWord={word}&cl=2&lm=-1&ie=utf-8&oe=utf-8&st=-1&ic=0&word={word}&face=0&istype=2nc=1&pn={pn}&rn=60"
        urls = (url.format(word=word, pn=x) for x in itertools.count(start=0, step=60))
        return urls

    def resolveImgUrl(self, html):
        re_url = re.compile(r'"objURL":"(.*?)"')
        imgUrls = [self.decode(x) for x in re_url.findall(html)]
        return imgUrls

    def downImg(self, imgUrl, dirpath, imgName):
        filename = os.path.join(dirpath, imgName)
        try:
            res = requests.get(imgUrl, timeout=15)
            if str(res.status_code)[0] == "4":
                print(str(res.status_code), ":" , imgUrl)
                return False
        except Exception as e:
            print("丟擲異常：", imgUrl)
            print(e)
            return False
        with open(filename, "wb") as f:
            f.write(res.content)
        return True

    def get_path(self):
        dirpath = os.getcwd() + '\\pictures'
        if not os.path.isdir(dirpath):
            os.mkdir(dirpath)
        return dirpath

    def Download(self):
        dirpath = self.get_path()
        index = 0
        for url in self.urls:
            html = requests.get(url, timeout=10).content.decode('utf-8')
            imgUrls = self.resolveImgUrl(html)
            if len(imgUrls) == 0:
                break
            for url in imgUrls:
                if self.downImg(url, dirpath, str(index) + ".jpg"):
                    index += 1
                    print("已下載 %s 張" % index)
        return index

if __name__ == "__main__":

    a = Spider("美女")
    a.Download()

執行該檔案將把圖片下載該目錄下的 picture 資料夾內。
命名為 BaiduSpider.py，先儲存下來。

二、接著來設計 GUI 介面

開啟 eric6，新建下專案，具體過程見教程（一）裡面的連結文章

點選窗體，在空白處右鍵新建個窗體，就命名為 window吧

可以看到視窗裡生成了 window.ui 檔案

並且自動跳入 qt designer

先實現最基本的介面，新增倆個 label，文字改為“請輸入關鍵詞” 和“————”，在右上角新增一個lineEdit，還有倆個 pushbutton 文字改為“開始下載” 和 “退出”。
給退出按鈕加上訊號槽。

點選 ok ，可以看到退出的動作訊號已經好了

儲存下檔案（工具欄第三個按鈕），關閉qt designer 回到 eric6
右鍵我們剛儲存的 window.ui 檔案，選擇編譯視窗，提示編譯成功，回到原始碼欄，多出了個UI_windows.py檔案

右鍵該檔案，開啟，在開始中選執行指令碼，發現我們剛設計的 GUI 視窗出現了，點選退出，視窗關閉

那麼我們一個簡單的 GUI 設計到此算完成了

三、整合

關閉 eric6，複製下UI_windows.py檔案，改名為 main.py，以及把第一步的 BaiduSpider.py 也放在這個資料夾

接著編輯 main.py，先開啟

# -*- coding: utf-8 -*-

# Form implementation generated from reading ui file 'E:\Python專案\Pyqt\eric\百度圖片下載器\window.ui'
#
# Created by: PyQt5 UI code generator 5.6
#
# WARNING! All changes made in this file will be lost!

from PyQt5 import QtCore, QtGui, QtWidgets

class Ui_Dialog(object):
    def setupUi(self, Dialog):
        Dialog.setObjectName("Dialog")
        Dialog.resize(527, 351)
        Dialog.setSizeGripEnabled(True)
        self.label = QtWidgets.QLabel(Dialog)
        self.label.setGeometry(QtCore.QRect(70, 70, 101, 16))
        self.label.setObjectName("label")
        self.lineEdit = QtWidgets.QLineEdit(Dialog)
        self.lineEdit.setGeometry(QtCore.QRect(232, 70, 141, 21))
        self.lineEdit.setObjectName("lineEdit")
        self.label_2 = QtWidgets.QLabel(Dialog)
        self.label_2.setGeometry(QtCore.QRect(60, 170, 161, 31))
        self.label_2.setObjectName("label_2")
        self.pushButton = QtWidgets.QPushButton(Dialog)
        self.pushButton.setGeometry(QtCore.QRect(270, 180, 93, 28))
        self.pushButton.setObjectName("pushButton")
        self.pushButton_2 = QtWidgets.QPushButton(Dialog)
        self.pushButton_2.setGeometry(QtCore.QRect(350, 290, 93, 28))
        self.pushButton_2.setObjectName("pushButton_2")

        self.retranslateUi(Dialog)
        self.pushButton_2.clicked.connect(Dialog.close)
        QtCore.QMetaObject.connectSlotsByName(Dialog)

    def retranslateUi(self, Dialog):
        _translate = QtCore.QCoreApplication.translate
        Dialog.setWindowTitle(_translate("Dialog", "百度圖片下載器"))
        self.label.setText(_translate("Dialog", "請輸入關鍵詞："))
        self.label_2.setText(_translate("Dialog", "________________"))
        self.pushButton.setText(_translate("Dialog", "開始下載"))
        self.pushButton_2.setText(_translate("Dialog", "退出"))


if __name__ == "__main__":
    import sys
    app = QtWidgets.QApplication(sys.argv)
    Dialog = QtWidgets.QDialog()
    ui = Ui_Dialog()
    ui.setupUi(Dialog)
    Dialog.show()
    sys.exit(app.exec_())

先把開頭的註釋刪掉，然後分析下程式碼
setupUI 這個方法主要是建立我們的 GUI 佈局，retranslateUi 方法則設定了一些文字內容，（由於在設計 GUI 的時候我並沒有對每個元素進行相應的命名，剛好可以從這看出元素的名字）
先設定 lineEdit，在使用者輸入什麼內容時，將內容傳送到label_2。

self.lineEdit.textChanged[str].connect(self.onChanged)

在 setupUI方法裡關於 lineEdit 新增上面程式碼，並新增 onChanged 方法。

    def onChanged(self, text):
        self.label_2.setText(text)
        self.label_2.adjustSize()
        self.keyword = text

如果 lineEdit的內容發生了改變，即使用者輸入了內容，就會將內容傳送到 label_2 並調整大小。然後建立私有變數 self.keyword（後面百度圖片下載要傳入的關鍵詞）
在使用者輸入內容後，點選開始下載則下載圖片，所以在 setupUI 里加上

self.pushButton.clicked.connect(self.Download)

新增 Download方法

    def Download(self.setText("正在下載")
        a = BaiduSpider.Spider(self.keyword)
        a.Download()

當點選開始下載後，則將按鈕文字改為“正在下載”，建立 BaiduSpider 例項，傳入關鍵詞，然後開始下載圖片。記得在帶面前面匯入BaiduSpider。即

import BaiduSpider

改完程式碼如下：


from PyQt5 import QtCore, QtGui, QtWidgets
import BaiduSpider

class Ui_Dialog(object):
    def setupUi(self, Dialog):
        Dialog.setObjectName("Dialog")
        Dialog.resize(527, 351)
        Dialog.setSizeGripEnabled(True)
        self.label = QtWidgets.QLabel(Dialog)
        self.label.setGeometry(QtCore.QRect(70, 70, 101, 16))
        self.label.setObjectName("label")
        self.lineEdit = QtWidgets.QLineEdit(Dialog)
        self.lineEdit.setGeometry(QtCore.QRect(232, 70, 141, 21))
        self.lineEdit.setObjectName("lineEdit")
        self.lineEdit.textChanged[str].connect(self.onChanged)
        self.label_2 = QtWidgets.QLabel(Dialog)
        self.label_2.setGeometry(QtCore.QRect(60, 170, 161, 31))
        self.label_2.setObjectName("label_2")
        self.pushButton = QtWidgets.QPushButton(Dialog)
        self.pushButton.setGeometry(QtCore.QRect(270, 180, 93, 28))
        self.pushButton.setObjectName("pushButton")
        self.pushButton_2 = QtWidgets.QPushButton(Dialog)
        self.pushButton_2.setGeometry(QtCore.QRect(350, 290, 93, 28))
        self.pushButton_2.setObjectName("pushButton_2")

        self.retranslateUi(Dialog)
        self.pushButton_2.clicked.connect(Dialog.close)
        QtCore.QMetaObject.connectSlotsByName(Dialog)
        self.pushButton.clicked.connect(self.Download)

    def retranslateUi(self, Dialog):
        _translate = QtCore.QCoreApplication.translate
        Dialog.setWindowTitle(_translate("Dialog", "百度圖片下載器"))
        self.label.setText(_translate("Dialog", "請輸入關鍵詞："))
        self.label_2.setText(_translate("Dialog", "________________"))
        self.pushButton.setText(_translate("Dialog", "開始下載"))
        self.pushButton_2.setText(_translate("Dialog", "退出"))


    def onChanged(self, text):
        self.label_2.setText(text)
        self.label_2.adjustSize()
        self.keyword = text

    def Download(self):
        self.pushButton.setText("正在下載")
        a = BaiduSpider.Spider(self.keyword)
        a.Download()


if __name__ == "__main__":
    import sys
    app = QtWidgets.QApplication(sys.argv)
    Dialog = QtWidgets.QDialog()
    ui = Ui_Dialog()
    ui.setupUi(Dialog)
    Dialog.show()
    sys.exit(app.exec_())

執行看看

發現有個意外，就是下載時程式就不能被選中了，再點選就會卡死。應該是執行緒中通訊的問題，這個先忽略下。

四、解決阻塞

在上面的程式中，當我們開始下載圖片時，由於該下載任務時長較久，就會阻塞程式，詳情見這篇文章[http://www.jianshu.com/p/ed47a8959854]
(pyqt多程式防阻塞)
按照這樣我們來修改下程式碼
先匯入 QTthread

from PyQt5.QtCore import *

再修改下面這些


from PyQt5 import QtCore, QtGui, QtWidgets
import BaiduSpider
from PyQt5.QtCore import *

class Ui_Dialog(object):
    def setupUi(self, Dialog):
        Dialog.setObjectName("Dialog")
        Dialog.resize(527, 351)
        Dialog.setSizeGripEnabled(True)
        self.label = QtWidgets.QLabel(Dialog)
        self.label.setGeometry(QtCore.QRect(70, 70, 101, 16))
        self.label.setObjectName("label")
        self.lineEdit = QtWidgets.QLineEdit(Dialog)
        self.lineEdit.setGeometry(QtCore.QRect(232, 70, 141, 21))
        self.lineEdit.setObjectName("lineEdit")
        self.lineEdit.textChanged[str].connect(self.onChanged)
        self.label_2 = QtWidgets.QLabel(Dialog)
        self.label_2.setGeometry(QtCore.QRect(60, 170, 161, 31))
        self.label_2.setObjectName("label_2")
        self.pushButton = QtWidgets.QPushButton(Dialog)
        self.pushButton.setGeometry(QtCore.QRect(270, 180, 93, 28))
        self.pushButton.setObjectName("pushButton")
        self.pushButton_2 = QtWidgets.QPushButton(Dialog)
        self.pushButton_2.setGeometry(QtCore.QRect(350, 290, 93, 28))
        self.pushButton_2.setObjectName("pushButton_2")

        self.retranslateUi(Dialog)
        self.pushButton_2.clicked.connect(Dialog.close)
        QtCore.QMetaObject.connectSlotsByName(Dialog)
        self.pushButton.clicked.connect(self.Download)

    def retranslateUi(self, Dialog):
        _translate = QtCore.QCoreApplication.translate
        Dialog.setWindowTitle(_translate("Dialog", "百度圖片下載器"))
        self.label.setText(_translate("Dialog", "請輸入關鍵詞："))
        self.label_2.setText(_translate("Dialog", "________________"))
        self.pushButton.setText(_translate("Dialog", "開始下載"))
        self.pushButton_2.setText(_translate("Dialog", "退出"))


    def onChanged(self, text):
        self.label_2.setText(text)
        self.label_2.adjustSize()
        self.keyword = text

    def Download(self):
        self.pushButton.setText("正在下載")
        self.thread = RunThread(self.keyword)
        self.thread.start()

class RunThread(QThread):

    trigger = pyqtSignal()
 
    def __init__(self,keyword):
        super(RunThread, self).__init__()
        self.key = keyword

    def run(self):
        
        a = BaiduSpider.Spider(self.key)
        a.Download()
        self.trigger.emit()


if __name__ == "__main__":
    import sys
    app = QtWidgets.QApplication(sys.argv)
    Dialog = QtWidgets.QDialog()
    ui = Ui_Dialog()
    ui.setupUi(Dialog)
    Dialog.show()
    sys.exit(app.exec_())

執行下，發現問題已經解決，但圖片下載速度好像有點慢

這時我們可以把百度圖片爬蟲換成多執行緒的，在上文的文章裡有多執行緒版本，這裡就不重複了，同樣改成一個類就行。

五、打包程式

用 pyinstaller 就行了，用pip下載完
在該目錄下按住 shift 右鍵開啟選擇在此開啟命令列，輸入

pyinstaller -F main.py

過一會兒檔案就打包完成了，在 dist 目錄下可以發現有個 main.exe檔案，挺大的。這個檔案可以單獨執行了，開啟，等一會兒就會跳出我們的 GUI介面，然後就可以下載圖片了。
雖然挺簡陋的，但起碼也是不錯的哈

使用 PyQt5 實現圖片檢視器
2020-04-20
QT
Python 萌新 - 實現 Markdown 圖片下載器
2018-01-19
Python
python 爬蟲下載百度美女圖片
2024-04-18
Python爬蟲
圖片懶載入外掛實戰
2016-07-28
ReactPHP 爬蟲實戰：下載整個網站的圖片
2019-01-20
ReactPHP爬蟲網站
如何用Python爬蟲實現百度圖片自動下載？
2019-03-01
Python爬蟲
前端實現點選下載圖片
2018-08-23
前端
SDWebImage類實現圖片的下載
2014-02-18
Web
vue點選下載圖片的實現
2021-01-03
Vue
圖片下載框架概述
2019-01-11
框架
Python 下載圖片
2024-03-12
Python
原生JS實現base64圖片下載-圖片儲存到本地
2019-02-16
JS
爬蟲第二彈：千圖網電商淘寶模板圖片下載
2018-06-14
爬蟲
NSURLConnection類實現下載網路圖片
2014-02-17
本地HTML中圖片下載
2018-08-25
HTML
仿SDWebImage多圖片下載
2015-11-12
Web
pyqt5的下載進度條實現模板
2021-09-09
QT
圖片爬取實戰一
2017-06-14
使用httpclient下載頁面、圖片
2020-02-27
HTTPclient
python自動下載圖片
2020-03-30
Python
Opencv官方樣例圖片下載
2020-11-18
OpenCV
獲取SDWebImage下載的圖片
2017-12-13
Web
實用爬蟲-03-爬取視訊教程課程名+連結+下載圖片
2018-10-29
爬蟲
圖片懶載入實現
2019-07-16
使用Python爬蟲實現自動下載圖片
2021-09-11
Python爬蟲
Android 圖片操作，Image實戰
2016-04-30
Android
『自定義View實戰』—— 仿ios圖示下載view
2019-02-20
ViewiOS
[文件教程]解決sae下編輯器圖片上傳問題
2019-05-11
Flutter完整開發實戰詳解(十、深入圖片載入流程)
2019-04-13
Flutter
Android 基礎之圖片載入(二)
2019-02-18
Android
Java實現的有道雲筆記圖片批量下載工具
2018-12-09
Java筆記
用thinkphp將網路上的圖片下載到本地伺服器
2016-10-23
PHP伺服器
設定二維碼圖片背景透明教程
2019-06-29
圖片懶載入js實現
2019-02-16
JS
Core Animation實戰二（寄宿圖）
2017-10-30
【Golang實現檔案伺服器】（二）圖片去重與縮圖功能
2017-12-14
Golang伺服器
實戰：圖片上傳元件開發
2018-02-02
元件
CSS-實戰-互動式圖片
2017-08-13
CSS