Python抓取淘寶IP地址資料
def fetch(ip): url = ' result = [] try: response = urllib.urlopen(url).read() jsondata = json.loads(response) if jsondata[u'code'] == 0: result.append(jsondata[u'data'][u'ip'].encode('utf-8')) result.append(jsondata[u'data'][u'country'].encode('utf-8')) result.append(jsondata[u'data'][u'country_id'].encode('utf-8')) result.append(jsondata[u'data'][u'area'].encode('utf-8')) result.append(jsondata[u'data'][u'area_id'].encode('utf-8')) result.append(jsondata[u'data'][u'region'].encode('utf-8')) result.append(jsondata[u'data'][u'region_id'].encode('utf-8')) result.append(jsondata[u'data'][u'city'].encode('utf-8')) result.append(jsondata[u'data'][u'city_id'].encode('utf-8')) result.append(jsondata[u'data'][u'county'].encode('utf-8')) result.append(jsondata[u'data'][u'county_id'].encode('utf-8')) result.append(jsondata[u'data'][u'isp'].encode('utf-8')) result.append(jsondata[u'data'][u'isp_id'].encode('utf-8')) else: return 0, result except: logging.exception("Url open failed:" + url) return 0, result return 1, result def worker(ratelimit, jobs, results, progress): global cancel while not cancel: try: ratelimit.ratecontrol() ip = jobs.get(timeout=2) # Wait 2 seconds ok, result = fetch(ip) if not ok: logging.error("Fetch information failed, ip:{}".format(ip)) progress.put("") # Notify the progress even it failed elif result is not None: results.put(" ".join(result)) jobs.task_done() # Notify one item except Queue.Empty: pass except: logging.exception("Unknown Error!")
def process(target, results, progress): global cancel while not cancel: try: line = results.get(timeout=5) except Queue.Empty: pass else: print >>target, line progress.put("") results.task_done()
def progproc(progressbar, count, progress): """ Since ProgressBar is not a thread-safe class, we use a Queue to do the counting job, like two other threads. Use this thread do the printing of progress bar. By the way, it will print to stderr, which does not conflict with the default result output(stdout). """ idx = 1 while True: try: progress.get(timeout=5) except Queue.Empty: pass else: progressbar.update(idx) idx += 1
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69903461/viewspace-2642675/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 淘寶IP地址查詢
- 淘寶的ip地址庫
- Javascript抓取京東、淘寶商品資料JavaScript
- java抓取HTML頁面的資料(淘寶頁面),JavaHTML
- 天貓、淘寶運營資料抓取技術概述
- IP地址在網頁抓取中有何作用網頁
- IP地址在網頁抓取中的作用網頁
- golang實現抓取IP地址的蜘蛛程式Golang
- python通過淘寶IP資料庫查詢地區Python資料庫
- Python爬蟲抓取資料,為什麼要使用代理IP?Python爬蟲
- 如何使用代理IP進行資料抓取,PHP爬蟲抓取亞馬遜商品資料PHP爬蟲亞馬遜
- python簡書資料抓取Python
- Python爬蟲,抓取淘寶商品評論內容!Python爬蟲
- 使用代理IP抓取資料需要注意什麼?
- 用Python爬蟲抓取代理IPPython爬蟲
- 用代理IP抓取大資料有什麼好處?大資料
- 使用代理IP抓取資料的四大優勢
- 利用python指令碼(xpath)抓取資料Python指令碼
- 網路爬蟲如何獲取IP進行資料抓取爬蟲
- Python向IP地址傳送字串Python字串
- 【TCP/IP】IP地址分類和特殊IP地址TCP
- IP地址
- 《反恐精英2》曝漏洞,可在遊戲中插入圖片、抓取玩家IP地址遊戲
- 如何用Python爬資料?(一)網頁抓取Python網頁
- 使用Python呼叫Flickr API抓取圖片資料PythonAPI
- MAC 地址與IP地址Mac
- 淘寶商品銷量資料介面,淘寶商品月銷量,淘寶商品總銷量資料介面
- 使用代理IP抓取社交媒體資料對企業有哪些作用?
- 淘寶拼多多京東上貨必備API 商品詳情頁資料抓取 APP商品詳情原資料APIAPP
- 使用Scrapy抓取資料
- 特殊IP地址
- 使用Python呼叫API介面獲取淘寶商品資料PythonAPI
- 淘寶商品詳情資料API介面php java pythonAPIPHPJavaPython
- 《網路IP地址管理》IP地址重要性薦
- 顯示連線Oracle資料庫的客戶端IP地址Oracle資料庫客戶端
- 利用IP代理進行網路抓取可以幫助企業收集哪些資料?
- 基於VC6.0的抓取TCP/IP資料包的C++實現TCPC++
- 電腦ip地址在哪 電腦ip地址查詢方法