工業大資料筆記2020
10.20DATAframe 筆記
1 如何構造新特徵,為什麼做乘法,除了均值有沒有其他方法。
2 訓練集和測試集如何劃分,怎麼進行K折交叉驗證,具體實現一下
3 每個特徵重要性計算一下
4 瞭解XGBT原理,以賽帶練,學習為主,擺正心態
5 怎麼檢視XGBT的引數,他訓練出來的資料是什麼?
衡量模型在未知資料上的準確率,稱為泛化誤差。
方差衡量預測模型的穩定性。模型每次預測的結果變異 程度,預測結果是否接近。
偏差:精確性
2 split():函式
split():拆分字串。通過指定分隔符對字串進行切片,並返回分割後的字串列表(list)
str.split(sep, maxsplit).
sep 是分割符,不寫分割符時表示所有的空字元,包括空格、換行(\n)、製表符(\t)等,有分隔符時,以該分隔符進行分割;maxsplit是分割次數。
DataFrame用法
3.2 檢視資料
3.2.1 檢視資料Viewing Data
檢視資料三部曲:
head():檢視資料前幾項,看資料長什麼樣
info():檢視資料型別,以及資料缺失情況
descibe():檢視資料描述統計性資訊,資料大概分佈情況)
3.2.2 選取資料Selection
相關文章
- 工業大資料漫談17:雲端計算與工業大資料的關係大資料
- 【工業大資料】工廠大資料之資料來源分析;如何挖掘並駕馭大資料的價值,成為“大資料企業”?大資料
- 大資料筆記01--大資料概述大資料筆記
- 大資料開發筆記大資料筆記
- 大資料個人筆記(一)大資料筆記
- 工業製造中的大資料分析大資料
- 工業大資料應用場景分析大資料
- 工業大資料應用聯盟成立大資料
- 筆記:大話資料結構筆記資料結構
- 大資料學習筆記(四)大資料筆記
- 大資料學習筆記(五)大資料筆記
- 大資料學習筆記(六)大資料筆記
- 大資料3.2 -- 實時筆記大資料筆記
- 【工業大資料】製造業大資料標準化應用及成功案例分析大資料
- 用好工業大資料的基礎是資料質量大資料
- 大資料學習筆記(十五)-大資料排程框架大資料筆記框架
- 【工業大資料】發展工業大資料,助力天津市先進製造研發基地建設大資料
- 資料開放與共享:德國工業4.0中的大資料大資料
- 大資料學習筆記(十七)-MapReduce大資料筆記
- 大資料學習筆記(十八)-MRUnit大資料筆記
- 工業大資料的四種用途和兩大價值大資料
- 工業資訊化 | 物聯網時代的八大工業大資料應用場景大資料
- 大資料在工業製造企業的重要性大資料
- 汽車工業協會:2020年2月汽車工業經濟執行資料
- 資料庫課程作業筆記資料庫筆記
- 大資料教程分享Actor學習筆記大資料筆記
- 大資料之 Hadoop學習筆記大資料Hadoop筆記
- 大資料學習筆記(十四)-Sqoop大資料筆記OOP
- 電商大資料學習筆記:理論大資料筆記
- 電商大資料學習筆記:實戰大資料筆記
- 工業資料通訊
- 2020畢業生就業大資料:IT行業平均薪資7839元就業大資料行業
- 工業大資料加速融合AI向智慧發展PUK大資料AI
- 工業大資料加速融合AI向智慧發展ZTXR大資料AI
- 工業大資料的關鍵技術是什麼大資料
- 實時工業大資料產品實踐——上汽集團資料湖大資料
- 【大資料】中國工程院院士何友:工業大資料及其應用大資料
- 工信部:將建2個公共工業雲平臺和1個工業大資料平臺大資料