python資料亂碼

weixin_34208283發表於2016-06-05

抓資料時一定要記得在最字尾上個extract()[0];如圖

311426-d78e67abb2482329.png

如果不寫extract(),爬到的資料是這樣的:

311426-14f60352f27cb140.png

寫了之後是這樣的:

311426-49464a2a54a63f6c.png


此時發現好像是亂碼,其實是Unicode編碼過的;原文是漢語,如果想看原文的話,後面必須綴上[0],即extrate()[0]


311426-b03a12ed45ad4319.png

儲存中文到檔案時可能會出現編碼導致的亂碼問題,此時import io    然後以utf8的方式開啟檔案就可以了;比如

io.open(filename,"w",encoding="utf8")

相關文章