Python資料分析初體驗,需要解答的三大問題!
本文約1200字,閱讀需要4分鐘
關鍵詞:Python 小白 環境搭建 讀取報錯 中文亂碼
本文針對初學Python的童鞋們的常見提問給出瞭解決方案
經常有初學python的小可愛,遇到一些很常見、自己又解決不掉的問題的時候,非常氣餒,甚至不想繼續寫程式碼~今天,我們就針對Python初體驗中提問最多的三大問題,一次給出解答,包學包會!
Windows系統並沒有自帶Python工具,需要我們自己搭建環境。對於小白,我們推薦大家安裝Anaconda,一個開源的Python發行版本,安裝和使用都很方便,還自帶大量工具包,簡直貼心。
許多小可愛在搭建環境的時候沒有按要求來,導致後面出現很多問題不得不花較多時間精力去解決,很不方便。這裡強調一下兩個點:
1)安裝路徑選擇C盤!
2)如圖兩個advanced options都要勾選!
此外,雖然Mac系統自帶Python工具,也建議使用Mac系統的初學小白安一個Anaconda,會方便很多~
首先將EXCEL檔案另存為CSV檔案,再呼叫pandas工具包進行讀取。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# numpy:科學計算工具包
# pandas:資料分析工具包
# malplotlib:圖表繪製工具包
# improt語句:載入工具包
data = pd.read_csv("路徑\\地市級黨委書記資料庫(2000-10).csv",encoding = "gbk",engine = 'python')
print(data)
對於讀取資料時的報錯情況,參考如下解決方案:
1)檢查所有程式碼是不是都是英文,特別是標點!
#檢查每一處逗號,單雙引號,括號
2)excel轉csv時,可設定編碼為UTF-8,並更改引數
encoding = 'utf-8'
3)mac系統匯出csv時,可以更改引數
encoding = "gb18030"
4)可將檔名改為英文檔名,例如“data.csv”
data.csv
5)設定engine='python'
engine = 'python'
6)在資料量不大的時候,也可以用read_excel, 程式碼則是
data=pd.read_excel(‘路徑.xlsx’)
前提是資料放在第一個sheet;如果是第二個sheet,程式碼改為
data=pd.read_excel(‘路徑.xlsx’, sheet_name=1)
*讀取sheet_name編號是從0開始的,1代表第二個sheet
matplotlib中文亂碼
也是很常見也很頭大的問題~這裡以win10系統,python3.6版本為例講解一下解決步驟:
*部分摘自原答案
感謝這位知友:司毅
1)找到matplotlib 配置檔案:
import matplotlib
print(matplotlib.matplotlib_fname())
# 示例輸出結果如下:
# D:\Program Files\Python36\Lib\site-packages\matplotlib\mpl-data
2)編輯器開啟此檔案 matplotlibrc
刪除font.family和font.sans-serif兩行前的#,並在font.sans-serif後新增微軟雅黑字型Microsoft YaHei
3)下載字型:msyh.ttf (微軟雅黑)放在matplotlib 字型資料夾下:
# D:\Program Files\Python36\Lib\site-packages\matplotlib\mpl-data\fonts\ttf
4)刪除.matplotlib/cache裡面的兩個快取字型檔案
C:\Users\你的使用者名稱\.matplotlib
5)重啟Python
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31558017/viewspace-2219665/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Python初學者需要注意的問題Python
- 表分析初體驗
- Python list,dict問題解答Python
- 有關onethink資料驗證若干問題,希望官方給予解答
- 軟體新人問題解答(一)
- 虛谷資料庫初體驗資料庫
- MySQL資料庫初體驗_gwMySql資料庫
- Python初體驗——列表Python
- [Python]Uvicorn初體驗Python
- 用Python解答ProjectEuler問題(4)PythonProject
- 用Python解答ProjectEuler問題(3)PythonProject
- 用Python解答ProjectEuler問題(1)PythonProject
- flutter安裝詳解--初體驗--問題解決Flutter
- SQL Server資料庫記憶體增加的問題分析SQLServer資料庫記憶體
- xmlhttp的問題,盼望解答XMLHTTP
- Python大資料分析學習.路徑問題Python大資料
- 大資料實驗問題大資料
- Python 全棧案例初體驗Python全棧
- 初學python的常見問題Python
- Python大資料分析學習.Pandas 資料匯入問題 (1)Python大資料
- 資料遷移中需要考慮的問題
- 初學 Python 需要安裝哪些軟體?Python
- 拓端:資料下的隱形眼鏡初體驗
- 資料治理需要注意哪些問題
- Hexo NexT 主題初體驗Hexo
- 程式碼分析引擎 CodeQL 初體驗
- 系統堆積和遊戲的核心體驗問題分析遊戲
- Python工程師必看的面試問題與解答(中)Python工程師面試
- Python程式設計常見問題與解答Python程式設計
- JVM問題及解答JVM
- 域名解析需要多久生效?域名解析常見問題解答
- 騰訊雲資料庫 TencentDB for Memcached一些常見問題的解答資料庫
- 大資料儲存:MongoDB實戰指南——常見問題解答大資料MongoDB
- 12c 傳統資料庫的ADG初體驗資料庫
- 初遇python--之新手學資料分析(1)Python
- 微信5.0初體驗, 解決人與人之後的溝通問題
- 資料分析的熱門 Excel 面試問題Excel面試
- 資料結構初階--堆排序+TOPK問題資料結構排序TopK