初遇python--之新手學資料分析(1)

陽光少年哈哈哈發表於2020-11-15

#**

初遇python資料分析(1)

**
##前言
python是一個指令碼語言,它最大的特點是動態的逐行執行,在執行前.py檔案會先生成一個位元組碼檔案.pyc,再由虛擬機器來逐行解釋執行,把每一行位元組碼翻譯成目標指令給CPU執行。
使用pytho進行資料分析,主要是因為python中有很多的功能強大的第三方庫進行資料分析,這其中anaconda整合了進兩百個科學計算庫,使用這個整合庫安裝使用都更為方便,筆者使用的是anaconda1.7.2版本。(官網下載比較慢,還可以在清華大學映象網站上面下載,國內的網站下載速度更快一些。(https://mirrors.tuna.tsinghua.edu.cn/))
##基礎知識
###python的基本語法規範
python是強調嚴格縮排的語言,在其他 語言中如果強調花括號{}的作用的話,縮排就顯得不那麼重要了,python不是這樣,它沒有花括號,判斷語句的所屬範圍就是使用 縮排來進行判斷的。比如如下的示例程式碼:

//這是一個簡單的畫五角星的程式碼
from turtle import*
color('red','red')
begin_fill()
for i in range(5):
    fd(200)
    rt(144)
end_fill()

從上面的程式碼中,就可以看出來python和其他語言在程式設計風格上面的不同之處了。
再比如如下兩段程式碼

 a=100
 if a>0:
 	print(a)
 else:
 	print(-a)
 	print("a<=0")
 a=100
 if a>0:
 	print(a)
 else:
 	print(-a)
 print("a<=0")

以上兩段程式碼因為程式碼縮排不同,輸出結果完全不同。
###基本資料型別和變數

內建資料型別種類
基本資料型別數值型別整數型別(Integer)浮點數(float)複數(conplex)
布林型(bool)
字串型別(string)
複合資料型別列表(List)元組(tuple)字典(dict)集合(set)

這裡的幾種基本資料型別比較簡單,和數學中的資料型別區別不大。在python中可以通過type()的方法獲取物件的資料型別。
資料的運算這裡挑出以下三種典型的簡單介紹:
/:精確的除法,如

>>>10/3
>3.3333333

//:地板除,即在數軸的反方向取反
%:取餘除,即求餘數
在這裡插入圖片描述
注意nono
Nono不能理解為0,只是空值,即佔位無值。
字串數值型別要使用單引號或雙引號表示:

>>>print("Hello Python")
>Hello Python

字串中的轉義字元和C一樣使用\表示
##python的格式化輸出
和C語言一樣,格式化輸出的實現通過%實現,常用的有以下幾種:
%s表示字串替換,
%d表示整數替換,
%f表示浮點數替換,
%x表示十六進位制整數替換
格式化輸出非常複雜,後面會進行詳細描述

字元編碼:Unicode
優點:將所有語言都統一到一套編碼中,不會再有亂碼產生
缺點:ASCII編碼是一個位元組,Unicode是兩個位元組編碼,導致需要一倍以上的儲存空間

UTF-8編碼:可變長編碼
彌補了Unicode編碼的缺點,可變長,編碼字元大小1-6個字元不等。

python3以上的版本使用Unicode編碼

變數
程式中,變數不僅代表數字,還代表資料型別。變數名必須是大小寫英文、數字和下劃線的組合,且不能用數字開頭。
python是動態語言
python中的變數是可以被反覆賦值,而且可以是不同型別的變數。這種本身型別不固定的語言稱之為動態語言。這裡與之對應的是Java,為靜態語言。
##複合資料型別
序列:列表(list),元組(tuple)
字典(dict)
集合(set)
序列常用的操作包括:索引,切片,連結,重複等,還提供了諸如求序列的元素個數,最大值,最小值等操作。
列表中還有一些專用操作:
在這裡插入圖片描述
lis的特點:
1.有序,佔用連續的記憶體空間
2.可變
3.可異構
用法:

#建立方法
classmates = ['Michael', 'Bob', 'Tracy']
#索引方法     #注意是從0開始進行索引的
classmates[1]

元組(tuple)的一些特點
1.tuple一旦初始化後,便不能修改

#建立方法
classmates ='Michael', 'Bob', 'Tracy'

2.獲取元素方法和list相同

#索引方法  
classmates[1]

==字典型別(dict)使用了鍵-值(key-value)的方式儲存,具有極快的查詢方式

#建立方法
d={'a':21,'c':22,'f':23}
#查詢方法
d['a']
21

集合set
特點:沒有重複元素,建立方法與dict相同,但只有key,沒有value
##條件判斷和迴圈
上面說了python是強調縮排的語言,在下面的語句中,可以看到其與C語言等其他語言的區別

age=20
if age>=18:
	print('your age is',age)
	print('adult')
else:
	print('teenager')

注意上方的:冒號非常重要

第一次認真寫部落格,希望各位大佬多多指正!!!!謝謝各位

相關文章