go實現抓妹子圖片

wwdyy發表於2016-10-26

轉自csdn，作者：vspeter

import (
"bytes"
"fmt"
"io/ioutil"
"net/http"
"os"
"regexp"
"strconv"
)

const (
PATH string = "~/meizi" //檔案儲存路徑
STARTURL string = "http://www.mzitu.com/model" //妹子圖模組列表頁url
CONCURRENCY int = 3 //併發下載數
)

var (
c1 chan string //通道：負責STARTURL,以後可以做成從命令引數裡讀取哦
c2 chan string //通道: 負責傳輸所有的模組url
c3 chan []string //通道：負責傳輸imgUrl
c4 chan int //通道: 負責傳輸每張圖片的下載完成狀態
c5 chan int //通道：負責傳輸當前下載數
)

func init() {
c1 = make(chan string, 1)
c2 = make(chan string, 100)
c3 = make(chan []string, 1000)
c4 = make(chan int, 3)
c5 = make(chan int, 10)
go CgetList()
go Cdownload()
}
func main() {
c1 <- STARTURL
go CgetModel()
num := 0
for count := range c5 {
num = num + count
fmt.Println("已下載:", num)
}
}

//排程器, 拉取所有模組
func CgetModel() {
modelPage := getPage(<-c1)
for i := 1; i <= modelPage; i++ {
modelUrl := STARTURL + "/page/" + strconv.Itoa(i)
c2 <- modelUrl
}
}

//排程器拉取所有圖片url,這裡其實還可以多分一層
func CgetList() {
k := 0
tmp := make([]string, 3)
for modelUrl := range c2 {
imgLists := getList(modelUrl)
for _, imgList := range imgLists {
imgPage := getPage(imgList)
for j := 1; j <= imgPage; j++ {
imgUrl := imgList + "/" + strconv.Itoa(j)
if k < CONCURRENCY {
tmp[k] = imgUrl
k++
} else {
c3 <- tmp
k = 0
}
}
}
if k != 0 {
c3 <- tmp
k = 0
}
}

}

//排程器, 下載圖片
func Cdownload() {
for imgUrls := range c3 {
if len(imgUrls) > 0 {
for _, imgUrl := range imgUrls {
go func() {
download(imgUrl)
c4 <- 1
}()
}
num := 0
for k := range c4 {
num = num + k
if num == len(imgUrls) {
c5 <- num
break
}
}
}
}
}

//圖片列表
func getList(url string) (l []string) {
reg, _ := regexp.Compile(`<h2><a href="(http://www.mzitu.com/\d*)" title="(.*?)" target="_blank">.*?</a></h2>`)
_, html, _ := getHtml(url)
lists := reg.FindAllStringSubmatch(html, 1000)
for _, list := range lists {
l = append(l, list[1])
}
return
}

//下載html
func getHtml(url string) (error, string, error) {
response, err := http.Get(url)
defer response.Body.Close()
html, err1 := ioutil.ReadAll(response.Body)
return err, string(html), err1
}

//獲取最大分頁
func getPage(url string) (page int) {
_, html, _ := getHtml(url)
reg, _ := regexp.Compile(`<span>(\d*)</span>`)
s := reg.FindAllStringSubmatch(html, 200)
if len(s) < 2 {
fmt.Println("獲取失敗")
os.Exit(-1)
}
page, _ = strconv.Atoi(s[len(s)-1][1])
return

}

//下載圖片
func download(url string) {
reg, _ := regexp.Compile(`<p><a href="http:\/\/www.mzitu.com/.*?" ><img src="(.*?)" alt="(.*?)" /></a></p>`)
reg1, _ := regexp.Compile(`http:\/\/pic\.dofay\.com/(.*)`)
_, html, _ := getHtml(url)
iterms := reg.FindAllStringSubmatch(html, 100)
for _, iterm := range iterms {
imgUrl := iterm[1]
imgPath := reg1.FindAllStringSubmatch(imgUrl, 100)
imgPaths := bytes.Split([]byte(imgPath[0][1]), []byte("/"))
path := PATH + "/" // + iterm[2]
imgResponse, _ := http.Get(imgUrl)
defer imgResponse.Body.Close()
imgByte, _ := ioutil.ReadAll(imgResponse.Body)
pInfo, pErr := os.Stat(path)
if pErr != nil || pInfo.IsDir() == false {
errDir := os.Mkdir(path, os.ModePerm)
if errDir != nil {
fmt.Println(errDir)
os.Exit(-1)
}
}
fn := path + "/" + string(imgPaths[len(imgPaths)-1])
_, fErr := os.Stat(fn)
var fh *os.File
if fErr != nil {
fh, _ = os.Create(fn)
} else {
fh, _ = os.Open(fn)
}
defer fh.Close()
fh.Write(imgByte)
}
}

Python3--妹子圖實戰
2018-04-17
Python
GO實現Redis：GO實現Redis叢集（5）
2023-03-27
GoRedis
用fiddler實現手機抓包
2018-09-10
c語言實現linux抓包
2016-03-16
C語言Linux
go 實現btc
2021-04-12
Go
go語言實現簡單爬蟲獲取頁面圖片
2022-11-14
Go爬蟲
GO實現Redis：GO實現Redis的AOF持久化（4）
2023-03-26
GoRedis持久化
GO 實現快速排序
2020-06-11
Go排序
Go interface實現分析
2018-12-18
Go
go RWMutex 的實現
2022-03-12
GoMutex
go實現http代理
2016-10-28
GoHTTP
fiddler 實現微信（PC端）小程式抓包
2020-11-16
實現圖片預覽
2017-11-14
實現圖片縮放
2016-02-10
JAVA實現圖片裁剪
2015-07-03
Java
go 實現歸併排序
2020-06-10
Go排序
Go channel 實現原理分析
2019-05-14
Go
Go能實現AOP嗎？
2022-04-19
Go
go proxy 實現反向代理
2021-06-18
Go
Go 閉包的實現
2018-09-30
Go
Go 如何實現多型
2023-10-26
Go多型
Go-grpc 實現
2022-02-18
GoRPC
go的令牌桶實現庫 go-rate
2021-04-06
Go
批次抓圖原來用Word也可實現(轉)
2007-08-13
Charles抓包實踐
2016-05-16
canvas實現圖片馬賽克
2019-02-27
Canvas
圖片懶載入實現
2019-07-16
vue實現圖片預覽
2021-09-09
Vue
圖片實現寬高比
2018-11-23
php實現圖片旋轉
2022-06-13
PHP
php實現pdf轉圖片
2022-06-07
PHP
圖片輪播元件實現
2017-10-22
元件
JNI實現圖片壓縮
2018-04-15
圖片模糊效果實現(RenderScript)
2017-10-09
javascript實現圖片滾動
2014-02-11
JavaScript
[譯] 思考實踐：用 Go 實現 Flutter
2019-07-07
GoFlutter
Go 實現 LeetCode 全集
2020-03-29
GoLeetCode
Go 實現雪花演算法
2019-04-05
Go演算法

go實現抓妹子圖片

轉自csdn，作者：vspeter

相關文章