好玩的github專案-可快速拉取各種網站的妹子圖coll-mz
轉自 github 使用者:fotomxq
collmz
介紹
COLL-MZ 專案主要用於採集煎蛋、飛 G、妹子圖、Xiuren 網站,以及本地類似圖片、視訊等檔案,並展示到瀏覽器中。
特別申明
該專案主要是個人學習 golang 而開發的第一個試水程式,請勿將該專案用於非法用途。
特點
專為悶騷程式設計師提供; 採集各大妹子圖片資料; 手動採集、定時採集(2 小時進行一次); 在瀏覽器快速瀏覽相關採集資料; 可整理本地檔案、視訊、漫畫、文字等資料; sqlite3 開放式資料庫,可自行構建訪問,方便二次開發; 可根據具體需求,構建其他網站的採集程式; 純 Golang 實現。
使用方法
1、下載專案到本地任意檔案;
2、執行 collmz-server-..exe 檔案;
3、通過瀏覽器訪問http://localhost:8888./config/config.json 檔案內自行修改埠。可以看到專案,可在
4、初始使用者名稱:admin@admin.com,密碼:adminadmin
程式碼編譯環境搭建步驟
1、安裝 golang 語言執行環境,配置好環境變數;
2、安裝 gcc 編譯環境,並配置好環境變數,推薦使用 mingw,下載地址:https://sourceforge.net/projects/mingw-w64/
3、安裝 golang 第三方庫:
- goquery
github.com/PuerkitoBio/goquery
- sqlite3
github.com/mattn/go-sqlite3
- session
github.com/gorilla/sessions
4、下載該專案程式碼,到 golang 工作目錄中任意目錄,建議使用 git 克隆。
5、因為是在 win10 x64 下開發、編譯的,所以只能保證該環境下執行良好,其他環境請自行排錯。
FAQ
1、可以不部署程式碼直接使用麼?
可以,下載整個專案,之後執行 exe 檔案即可。專案內的 controller 資料夾可自行刪除。
2、編譯失敗是什麼情況?
常見的錯誤主要出在 sqlite3 上,因為該第三方庫是用 C 實現的,需要用到 GCC 編譯器,也就是 mingw,所以如果安裝錯版本、沒有配置對環境變數,都會報錯。64 位系統一定要使用 64 位的 GCC 編譯。
3、想在此結構上構建其他採集器怎麼做?
在 controller 下有 coll-children-...go 的檔案,這些檔案都是對應的採集器程式碼,可參考這些程式碼寫自己需要的採集專案。
可使用構建好的相關框架,首先在 coll.go 內註冊好採集器,這樣可直接通過瀏覽器訪問到採集器;然後自行建立 go 檔案寫入程式碼,這樣就可以了。
注意,如果是正在開發的專案,CollChildren.dev 儘量等於 true,這樣在瀏覽器端內容易區分。
CollOperate.Auto...(),這幾個方法是整合了大部分情況下采集工作,可以極大方便採集工作。
關於專案邏輯、思維導圖
4、採集速度如何?
由於 sqlite3 無法多開執行緒,所以一個採集器只能對應一個併發操作,如果發現重複執行、在採集過程中瀏覽資料會自動阻止。
每個採集器有各自的執行緒。
5、為什麼某些採集器不能用?
個別採集器因為國內區域網限制,需要自行解決問題。
其次極個別採集的網站存在 JS 動態載入功能,以及各種阻攔採集工作的功能,所以未來看個人開發能力提升後再解決。這類採集器都標記了 dev 狀態,你可以在採集介面中看到。
6、如何修改初始使用者名稱和密碼?
在寫這段文字的時候,我才想起來沒有做這個頁面,所以暫時請用 sqlite 工具開啟./content/database/coll-mz.sqlite 資料庫,修改其中的 user 表資料即可。
=============================================================== github 地址:https://github.com/fotomxq/coll-mz
- 加微信實戰群請加微信(註明:實戰群):gocnio
相關文章
- 關聯 github 拉取專案Github
- github上一個好玩的專案Github
- 好玩的github專案-go語言統計github上面各個程式語言每月的新增或者更新的數量GithubGo
- 好玩的github專案-go語言的windows GUI介面庫GithubGoWindowsGUI
- 一個高效搜尋github專案的網站Github網站
- 通過互動式命令從github拉取專案模板並建立新專案Github
- GitHub上專案自動拉取和部署到伺服器Github伺服器
- git拉取專案以及提交專案Git
- 好玩的github專案-golangman開源專案-幫助具有其他語言開發經驗的人快速上手golangGithubGolang
- Git 拉取 GitLab 分支上的專案Gitlab
- 快速建立漂亮的Github專案主頁Github
- 3 個好玩的前端開源專案「GitHub 熱點速覽」前端Github
- 一些好玩的網站網站
- 加密解密、食譜、新冠序列,各種有趣的開源專案Github上都有加密解密Github
- 良心GitHub專案:各種機器學習任務的頂級結果(論文)彙總Github機器學習
- git只拉取github部分程式碼的方法Github
- Github快速搭建個人/組織網站Github網站
- 好玩的github專案-NES - Go 語言開發的任天堂遊戲模擬器GithubGo遊戲
- 推薦個超好玩的專案
- 使用Hexo+ github快速搭建自己的部落格網站(一)HexoGithub網站
- 使用Hexo+ github快速搭建自己的部落格網站(二)HexoGithub網站
- 好玩的github專案-微信公眾號爬蟲 (只需設定代理, 一鍵可以爬取所有歷史文章)Github爬蟲
- 爬取彼岸網站的桌布(分類可選)網站
- antd專案各種webpack打包方案Web
- 談網站專案的WBS分解網站
- IOS中獲取各種檔案的目錄路徑的方法iOS
- Python爬蟲入門教程 2-100 妹子圖網站爬取Python爬蟲網站
- 增強網站可訪問性的25種方法網站
- 讓專案快速獲批的五種方法(轉)
- [Github 專案推薦] 一個更好閱讀和查詢論文的網站Github網站
- 小米公司的github網站地址Github網站
- Win7下快速預覽各種型別的文字檔案Win7型別
- 特別好的一個網站。各種JAVA JDK的映象分發。網站JavaJDK
- Java獲取Spring的各種物件JavaSpring物件
- iOS中獲取各種檔案的目錄路徑的方法(轉)iOS
- Github 建立自己的專案Github
- 好玩的github專案-科大訊飛語音linux線上語音合成後臺服務GithubLinux
- Github Dorisoy網盤專案Github