【Python】Python抓取分享頁面的原始碼示例

程式設計師啟航發表於2019-06-27

本文章是關於利用Python方法來抓取某網站分享頁面中的原始碼方法示例。需要大家注意的是Python抓取分享頁面的原始碼示例,是要在執行時匯入BeautifulSoup.py檔案後才可以使用。

Python抓取分享頁面的原始碼示例,需要用到python urllib2模組方法,及BeautifulSoup模組。

原始碼如下:

#coding:utf-8
import urllib2
from BeautifulSoup import BeautifulSoup
 
'''
www.iplaypy.com
'''
#define
def readPage(Url):
    page = urllib2.urlopen(Url).read()
    pageContent = BeautifulSoup(page)
    OSC_Content = pageContent.find("div",{'id':'OSC_Content'})
    preHandleCode = OSC_Content.find('pre').next
    print preHandleCode
     
 
'''
頁面的url需指定
''' 
#call  
readPage('http://www.xxxxxx.net/code/snippet_580365_11857')

這裡的目標網站已經隱藏,大家可針對自己要抓取的目標站,參考本python原始碼適當修改。

大家在學python的時候肯定會遇到很多難題,以及對於新技術的追求,這裡推薦一下我們的Python學習扣qun:784758214,這裡是python學習者聚集地!!同時,自己是一名高階python開發工程師,從基礎的python指令碼到web開發、爬蟲、django、資料探勘等,零基礎到專案實戰的資料都有整理。送給每一位python的小夥伴!每日分享一些學習的方法和需要注意的小細節

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69913713/viewspace-2648938/,如需轉載,請註明出處,否則將追究法律責任。

相關文章