一個小專案(爬蟲)的誕生全過程
下面是一個小爬蟲的整個誕生過程
step 1
在本地使用git管理工具:
mkdir Douban_Movie#建立並進入該目錄下
git init#初始化
vim readme.txt#在本檔案中寫入相關的必要資訊
git add readme.txt#新增
git commit -m ‘add comment’#提交到本地
step 2
在github上新建一個倉庫Douban_Movie後
git remote add origin git@github.com:icheli/Douban_Moive.git#或者git remote add origin https://github.com/ichenli/Douban_Movie.git 首次互動要建立連線
git push -u origin master#提交到github上,下載用git pull origin master
至此我們就知道如何將程式碼提交到github上了,下面我們所要做的就是程式設計了。
step3
在本地編寫程式之後就可以提交到本地git和github的伺服器上了
git add movie_crawler.py
git commit -m "this is the crawler"
git remote add origin git@git.com:ichenli/ZhiHu_movie.git#或者git remote add origin https://github.com/ichenli/ZhiHu_Movie.git(即github上專案的連結)
<pre name="code" class="python">git push -u origin master
有關程式的部分,已經放到github上了,程式其實很簡單,就是爬取了豆瓣上按類別的電影排序,爬取了其中前34個類別,例如愛情,喜劇,動畫等多種類別的電影,並依次獲取電影的ID,名稱,上映年份,型別,片長,分數,評價人數和劇情簡介。
step4
python3使用mysql資料庫需要pymysql包,據說還可以使用mysql-connector,但是沒用過,在https://pypi.python.org/pypi/PyMySQL3 下載pymysql包,cd進入目錄下
python3 setup.py install#安裝,好像需要管理員許可權
若在python3中能匯入pymysql包即代表成功,成功後就可以繼續程式設計啦!
注:程式已經上傳到github上啦,https://github.com/ichenli/Douban_Movie,大家如果沒有安裝資料庫或者不想涉及資料庫,稍加修改即可執行,程式碼很簡單。
大家有什麼不懂的或者我哪兒寫錯了都歡迎留言!
相關文章
- 一隻優雅的小爬蟲誕生記爬蟲
- Python爬蟲小專案:爬一個圖書網站Python爬蟲網站
- 人生第一個過萬 Star 的 GitHub 專案誕生Github
- 爬蟲小專案爬蟲
- python爬蟲初探--第一個python爬蟲專案Python爬蟲
- 精通Scrapy網路爬蟲【一】第一個爬蟲專案爬蟲
- Python爬蟲:通過做專案,小編了解了酷狗音樂的加密過程Python爬蟲加密
- xxfpmW 的誕生過程
- 第一個分散式爬蟲專案分散式爬蟲
- 如何快速建立一個爬蟲專案爬蟲
- Scrapy入門-第一個爬蟲專案爬蟲
- Python爬蟲深造篇(四)——Scrapy爬蟲框架啟動一個真正的專案Python爬蟲框架
- 使用node爬蟲做了一個vue小專案記錄使用筆記爬蟲Vue筆記
- (python)爬蟲----八個專案帶你進入爬蟲的世界Python爬蟲
- 爬蟲專案實戰(一)爬蟲
- Python網路爬蟲實戰專案大全 32個Python爬蟲專案demoPython爬蟲
- 32個Python爬蟲專案demoPython爬蟲
- 爬蟲專案爬蟲
- python爬蟲實操專案_Python爬蟲開發與專案實戰 1.6 小結Python爬蟲
- 總數量超過五十個,史上最全的爬蟲專案集合爬蟲
- python爬蟲-33個Python爬蟲專案實戰(推薦)Python爬蟲
- 【爬蟲】爬蟲專案推薦 / 思路爬蟲
- 104個實用網路爬蟲專案資源整理(超全)爬蟲
- Python網路爬蟲實戰小專案Python爬蟲
- 送給Python小白學習爬蟲的小專案Python爬蟲
- 從零開始的爬蟲專案(一)爬蟲
- 爬蟲專案部署爬蟲
- Python 第一個爬蟲,爬取 147 小說Python爬蟲
- 爬蟲過程中遇到的問題爬蟲
- 爬蟲的例項專案爬蟲
- scrapy 框架新建一個 爬蟲專案詳細步驟框架爬蟲
- 課程設計:python_網路爬蟲專案Python爬蟲
- 資料分析專案(一)——爬蟲篇爬蟲
- 使用nodeJS寫一個簡單的小爬蟲NodeJS爬蟲
- 這 6 個爬蟲開源專案 yyds爬蟲
- 32個Python爬蟲實戰專案,滿足你的專案慌Python爬蟲
- python爬蟲例項專案大全-GitHub 上有哪些優秀的 Python 爬蟲專案?Python爬蟲Github
- 奇伢爬蟲專案爬蟲
- 爬蟲專案總結爬蟲