python怎麼讀_4個Python經典專案實戰，練手必備哦！

weixin_39646412發表於2020-12-07

原文網址 : https://blog.csdn.net/weixin_39646412/article/details/111294378

Python是一種極具可讀性和通用性的程式語言。Python這個名字的靈感來自於英國喜劇團體Monty Python，它的開發團隊有一個重要的基礎目標，就是使語言使用起來很有趣。Python易於設定，並且是用相對直接的風格來編寫，對錯誤會提供即時反饋，對初學者而言是個很好的選擇。

Python是一種多正規化語言，也就是說，它支援多種程式設計風格，包括指令碼和麵向物件，這使得它適用於通用目的。隨著越來越多地在工業中，被諸如聯合太空聯盟(NASA的主要飛機支援承包商)和工業光魔(VFX 和盧卡斯影業的動畫工作室)等組織使用，Python 為那些尋求額外程式語言的人提供了巨大的潛力。
當一個重要的被稱為comp.lang.python的Python新聞組在1994年形成時，Python 的使用者基礎不斷增長，這為Python成為開源開發中最受歡迎的程式語言之一鋪平了道路。

Python當下真的很火。Python實戰專案，也一直尤為關注，接下來，和大家介紹下Python練手的實戰專案。

Python專案練習一：即時標記

這是《Python基礎教程》後面的實踐，照著寫寫，一方面是來熟悉Python的程式碼方式，另一方面是練習使用Python中的基本的以及非基本的語法，做到熟能生巧。

這個專案一開始比較簡單，不過重構之後就有些複雜了，但是更靈活了。

按照書上所說，重構之後的程式，分為四個模組：處理程式模組，過濾器模組，規則(其實應該是處理規則)，語法分析器。

先來說處理程式模組，這個模組的作用有兩個，一個是提供那些固定的html標記的輸出(每一個標記都有start和end)，另一個是對這個標記輸出的開始和結束提供了一個友好的訪問介面。來看下程式handlers.py：

這個程式堪稱是整個“專案”的基石所在：提供了標籤的輸出，以及字串的替換。理解起來也比較簡單。

再來看第二個模組“過濾器”，這個模組更為簡單，其實就是一個正規表示式的字串。相關程式碼如下：

裡插入圖片描述

這就是三個過濾器了，分別是：強調牌過濾器(用×號標出的)，url牌過濾器，email牌過濾器。熟悉正規表示式的同學理解起來是沒有壓力的。

再來看第三個模組“規則”，這個模組，拋開那祖父類不說，其他類應該有的兩個方法是condition和action，前者是用來判斷讀進來的字串是不是符合自家規則，後者是用來執行操作的，所謂的執行操作就是指呼叫“處理程式模組”，輸出前標籤、內容、後標籤。來看下這個模組的程式碼，其實這個裡面幾個類的關係，畫到類圖裡面看會比較清晰。rules.py:

補充utils.py:

總結一下：

最後隆重的來看下“語法分析器模組”，這個模組的作用其實就是協調讀入的文字和其他模組的關係。在往重點說就是，提供了兩個存放“規則”和“過濾器”的列表，這麼做的好處就是使得整個程式的靈活性得到了極大的提高，使得規則和過濾器變成的熱插拔的方式，當然這個也歸功於前面在寫規則和過濾器時每一種型別的規則(過濾器)都單獨的寫成了一個類，而不是用if..else來區分。看程式碼：

這個模組裡面的處理思路是，遍歷客戶端(也就是程式執行的入口)給插進去的所有的規則和過濾器，來處理讀進來的文字。

有一個細節的地方也要說一下，其實是和前面寫的呼應一下，就是在遍歷規則的時候通過呼叫condition這個東西來判斷是否符合當前規則。

我覺得這個程式很像是命令列模式，有空可以複習一下該模式，以保持記憶網節點的牢固性。

最後說一下我以為的這個程式的用途：

1、用來做程式碼高亮分析，如果改寫成js版的話，可以做一個線上程式碼編輯器。

2、可以用來學習，供我寫博文用。

還有其他的思路，可以留下您的真知灼見。

補充一個類圖，很簡陋，但是應該能說明之間的關係。另外我還是建議如果看程式碼捋不清關係最好自己畫圖，自己畫圖才能熟悉整個結構。

Python專案練習二：畫幅好畫

這是《Python基礎教程》中的第二個專案，關於Python操作PDF，涉及到的知識點：

1、urllib的使用

2、reportlab庫的使用

這個例子著實很簡單，不過我發現在Python裡面可以直接在陣列［］裡面寫for迴圈，真是越用越方便。

下面是程式碼：

Python專案練習三：萬能的XML

這個專案的名稱與其叫做萬能的XML不如叫做自動構建網站，根據一份XML檔案，生成對應目錄結構的網站，不過只有html還是太過於簡單了，如果要是可以連帶生成css那就比較強大了。這個有待後續研發，先來研究下怎麼html網站結構。既然是通過XML結構生成網站，那所有的事情都應該由這個XML檔案來。先來看下這個XML檔案，website.xml：

有了這個檔案，下面應該來看怎麼通過這個檔案生成網站。

首先我們要解析這個xml檔案，Python解析xml和在Java中一樣，有兩種方式，SAX和DOM，兩種處理方式不同點在於速度和範圍，前者講究的是效率，每次只處理文件的一小部分，快速而能有效的利用記憶體，後者是相反的處理方式，先把所有的文件載入到記憶體，然後再進行處理，速度比較慢，也比較消耗記憶體，唯一的好處就是可以操作整個文件。

在Python中使用sax方式處理xml要先引入xml.sax中的parse函式，還有xml.sax.handler中的ContentHandler，後面的這個類是要和parse函式來配合使用的。使用方式如下：parse('xxx.xml',xxxHandler),這裡面的xxxHandler要繼承上面的ContentHandler，不過只要繼承就行，不需要有所作為。然後這個parse函式在處理xml檔案的時候，會呼叫xxxHandler中的startElement函式和endElement函式來一個xml中的標籤的開始和結束，中間的過程使用一個名為characters的函式來處理標籤內部的所有字串。

有了上面的這些認識，我們已經知道如何處理xml檔案了，然後再來看那個罪惡的源頭website.xml檔案，分析其結構，只有兩個節點：page和directory，很明顯page表示一個頁面，directory表示一個目錄。

所以處理這個xml檔案的思路就變的清晰了。讀取xml檔案的每一個節點，然後判斷是page還是directory如果是page則建立html頁面，然後把節點中的內容寫到檔案裡。如果遇到directory就建立一個資料夾，然後再處理其內部的page節點(如果存在的話)。

下面來看這部分程式碼，書中的實現比較複雜，比較靈活。先來看，然後在分析。

看起來這個程式上面分析的複雜了一些，不過偉人毛毛說過，任何複雜的程式都是紙老虎。那我們再來分析一下這個程式。

首先看到這個程式是有兩個類，其實完全可以當作一個類，因為有了繼承。

然後再來看它多了些什麼，除了我們分析出來的startElement和endElement以及characters，多出來了startPage，endPage;startDirectory，endDirectory;defaultStart，defaultEnd;ensureDirectory;writeHeader，writeFooter;和dispatch，這些個函式。除了dispatch，前面的函式都很好理解，每一對函式都是單純的處理對應的html標籤以及xml節點。而dispatch比較複雜，複雜之處在於他是用來動態拼合函式並且進行執行的。

dispatch的處理思路是，首先根據傳遞的引數(就是操作名稱以及節點名稱)判斷是否存在對應的函式如startPage，如果不存在則執行default+操作名稱：如defaultStart。

一個函式一個函式搞清楚之後，就知道整個處理流程是什麼樣了。首先建立一個public_html的檔案，存放整個網站，然後讀xml的節點，通過startElement和endElement呼叫dispatch進行處理。然後就是dispatch怎麼呼叫具體的處理函式了。到此為止，這個專案算是分析完了。

主要掌握的內容一個是python中使用SAX處理XML，另一個就是python中的函式的使用，比如getattr，傳引數時的星號……

python專案練習四：新聞聚合

書中的第四個練習，新聞聚合。現在很少見的一類應用，至少我從來沒有用過，又叫做Usenet。這個程式的主要功能是用來從指定的來源(這裡是Usenet新聞組)收集資訊，然後講這些資訊儲存到指定的目的檔案中(這裡使用了兩種形式：純文字和html檔案)。這個程式的用處有些類似於現在的部落格訂閱工具或者叫RSS訂閱器。

先上程式碼，然後再來逐一分析：

這個程式，首先從整體上進行分析，重點部分在於NewsAgent，它的作用是儲存新聞來源，儲存目標地址，然後在分別呼叫來源伺服器(NNTPSource以及SimpleWebSource)以及寫新聞的類(PlainDestination和HTMLDestination)。所以從這裡也看的出，NNTPSource是專門用來獲取新聞伺服器上的資訊的，SimpleWebSource是獲取一個url上的資料的。而PlainDestination和HTMLDestination的作用很明顯，前者是用來輸出獲取到的內容到終端的，後者是寫資料到html檔案中的。

有了這些分析，然後在來看主程式中的內容，主程式就是來給NewsAgent新增資訊源和輸出目的地址的。

這確實是個簡單的程式，不過這個程式可是用到了分層了。

4個Python經典專案實戰，練手必備哦
2019-09-10
Python
【Python學習實踐教程】10個Python經典專案實戰，練手必備
2022-02-26
Python
70個Python經典實用練手專案（附原始碼）
2022-07-01
Python原始碼
python練手經典100例-推薦幾個適合新手練手的Python專案《python入門例子》
2021-10-21
Python
這4個Python實戰專案，讓你瞬間讀懂Python！
2018-08-25
Python
python專案歸納總結-這4個Python實戰專案，讓你瞬間讀懂Python！
2020-11-01
Python
python能做什麼專案-這十個Python實戰專案，讓你瞬間讀懂Python！
2020-10-28
Python
學python找不到專案練手？別擔心，70個python練手專案給你充實感
2019-01-16
Python
推薦十大Python經典練手專案，讓你的Python技能點全亮
2020-12-11
Python
這十個Python實戰專案，讓你瞬間讀懂Python！
2018-08-26
Python
十個Python練手的實戰專案，學會這些Python就基本沒問題了
2018-03-27
Python
python實戰專案
2021-08-23
Python
能夠快速提升 Python 開發技能的 4 個實戰專案
2020-05-13
Python
拯救Python新手的幾個專案實戰
2019-01-22
Python
推薦7個Python上手實戰專案
2020-10-15
Python
python實戰一個完整的專案-年終課程盤點｜16 個 Python 綜合實戰專案合集
2022-01-23
Python
視訊教程-Python機器學習經典案例實戰-Python
2020-05-28
Python機器學習
Python網路爬蟲實戰專案大全 32個Python爬蟲專案demo
2019-04-24
Python爬蟲
python爬蟲-33個Python爬蟲專案實戰(推薦)
2020-10-28
Python爬蟲
Jenkins部署Python專案實戰
2019-04-04
JenkinsPython
Python專案實戰例項
2019-07-19
Python
初學Python必備十大經典案例(初學者必看)❃✿❈❉❀❁下
2020-09-30
Python
Python爬蟲專案100例，附原始碼！100個Python爬蟲練手例項
2021-09-09
Python爬蟲原始碼
python實戰之爬蟲面試必備題目
2021-09-11
Python爬蟲面試
給Python初學者的最好練手專案
2018-04-04
Python
7個Python實戰專案(附原始碼)，拿走就用
2021-12-20
Python原始碼
Python的福音，涵蓋20+種初學者必練專案，這本實戰書太火了
2022-02-15
Python
python怎麼讀取配置檔案
2021-09-11
Python
初學Python不知道做什麼專案好？來看看練手專案如何？
2019-01-09
Python
有趣的十個Python實戰專案，讓你瞬間愛上Python！
2018-09-23
Python
32個Python爬蟲實戰專案，滿足你的專案慌
2019-03-04
Python爬蟲
Python爬蟲開發與專案實戰 4: HTML解析大法
2018-05-15
Python爬蟲HTML
完整的python專案例項-Python例項練手專案彙總（附原始碼）
2020-10-28
Python原始碼
推薦：一個適合於Python新手的入門練手專案
2019-01-03
Python
吐血總結！10個Python實戰專案（附原始碼）
2020-06-30
Python原始碼
最新Python開發專案實戰(完整)
2019-05-02
Python
Python的開發必備：如何建立一個優秀的專案工程環境
2019-09-04
Python
Python之檔案讀寫小練
2020-10-04
Python

python怎麼讀_4個Python經典專案實戰，練手必備哦！

Python專案練習一：即時標記

Python專案練習二：畫幅好畫

python專案練習四：新聞聚合

相關文章