Box-cox資料變換

欧阳维斯诺夫斯基發表於2024-03-19

原文網址 : https://www.cnblogs.com/kunrenzhilu/p/18082730

Box-cox Transformation

背景

有很多時候我們需要把右偏（長尾）分佈的資料進行數值變換，將其變為接近正態分佈的形式，好使用統計工具。Box-cox的原理其實就是用一系列f(y;lambda)對y做變換嘗試，看看哪一個變換f(lambda)能夠使得Y'=f(Y)變成正態分佈，越正態越好。要注意，這裡的transformation是指特定的函式，要求函式是單調的，不能改變原有函式的順序。因此，對資料也有要求，即不能是負數的，否則偶次方的變換就不能用了。

方法

白色框框裡的變換才是關鍵，除以lambda和減1都只是簡單的平移和放縮，不能改變分佈的形狀。圖片來源

求解

百度百科裡面有詳細的求解過程。核心思想就是，將變換後的資料代入正態分佈的公式，然後求最大似然；然後比較不同lambda的最大似然值，用最高的作為lambda的解。固定後對所有數值做統一變換。雖然最大似然的值和lambda的取值不是線性關係，但是可以取樣一系列lambda，透過蒙特卡洛的方法來求解最好的lambda。

資料預處理-資料整合與資料變換
2020-01-19
資料預處理- 資料清理資料整合資料變換資料規約
2020-01-15
Torch 中Dataset 和Dataloader 的資料變換
2024-08-25
空間大資料的資料變換與價值提煉
2024-10-15
大資料
資料變換-歸一化與標準化
2020-11-30
Slate文件編輯器-WrapNode資料結構與操作變換
2024-11-18
資料結構
資料換機
2024-07-05
初探G6, 切換資料時保證圖位置不變
2018-12-19
z 變換
2018-11-06
Hough變換
2024-07-28
仿射變換及其變換矩陣的理解
2019-05-30
矩陣
資料庫轉換工具，不同資料庫之前任意轉換
2020-08-07
資料庫
資料夾變exe資料找回方法
2022-06-18
Echarts根據資料長度變換柱狀圖柱狀的顏色
2019-01-10
Echarts
Stimulsoft Reports如何建立新的資料轉換、編輯資料轉換
2021-04-25
OpenCV計算機視覺學習（3）——影像灰度線性變換與非線性變換（對數變換，伽馬變換）
2020-10-10
OpenCV計算機視覺
Z變換（2020.10.21）
2020-10-21
頻域變換
2020-10-14
Hive資料格式轉換
2019-01-08
Hive
資料型別轉換
2018-12-29
資料型別
python-資料交換
2024-07-26
Python
資料類新轉換
2024-07-14
資料集轉換JSON
2024-07-04
JSON
ROS TF ：使用 TF 設定機器人釋出座標變換使用座標變換將感測器資料轉換為機器人座標系下
2020-11-24
ROS機器人
小波變換與傅立葉變換的區別
2018-05-29
資料分析-皮膚資料變截距模型
2020-11-01
模型
mxnet資料格式轉換為tensorflow，pytorch資料
2018-12-14
PyTorch
voc資料集轉換成coco資料集
2024-04-27
資料型別，變數
2019-01-26
資料型別變數
不可變資料之Immutable
2020-08-24
灰度變換函式：對數及對比度拉伸變換
2019-05-19
函式
將json資料轉換為Python字典將json資料轉換為Python字典
2023-11-07
JSONPython
可變資料型別（mutable)與不可變資料型別（immutable)總結
2024-05-27
資料型別
COCO資料集格式互換
2018-11-09
MysqlsqoopHDFS 資料交換實驗
2018-10-30
MySqlOOP
什麼是資料轉換？
2018-12-03
JavaScript 資料型別轉換
2018-12-19
JavaScript資料型別
javascript資料型別轉換
2018-06-12
JavaScript資料型別

Box-cox資料變換

背景

方法

求解

相關文章