統計資料歸一化與標準化

CopperDong發表於2017-09-08

歸一化:

1)把資料變成(0,1)之間的小數

2)把有量綱表示式變成無量綱表示式

 

歸一化演算法有:

1.線性轉換

      y=(x-MinValue)/(MaxValue-MinValue

2.對數函式轉換:

     y=log10(x)

3.反餘切函式轉換

     y=atan(x)*2/PI

4.線性也與對數函式結合

     式(1)將輸入值換算為[-1,1]區間的值,

     在輸出層用式(2)換算回初始值,其中和分別表示訓練樣本集中負荷的最大值和最小值。

 

資料規範化:

1)把資料按比例縮放,使之落入一個小的空間裡

 

1.最小-最大規範化(線性變換)

     y=( (x-MinValue) / (MaxValue-MinValue) )(new_MaxValue-new_MinValue)+new_minValue

 

2.z-score規範化(或零-均值規範化)

 y=(x-X的平均值)/X的標準差

 優點:當X的最大值和最小值未知,或孤立點左右了最大-最小規範化時, 該方法有用

3.小數定標規範化:通過移動X的小數位置來進行規範化

 y= x/10的j次方  (其中,j使得Max(|y|) <1的最小整數

4.對數Logistic模式:

     新資料=1/(1+e^(-原資料))

5.模糊量化模式:

新資料=1/2+1/2sin[派3.1415/(極大值-極小值)*

     (X-(極大值-極小值)/2) ]       X為原資料

相關文章