工業大資料筆記2020
10.20DATAframe 筆記
1 如何構造新特徵,為什麼做乘法,除了均值有沒有其他方法。
2 訓練集和測試集如何劃分,怎麼進行K折交叉驗證,具體實現一下
3 每個特徵重要性計算一下
4 瞭解XGBT原理,以賽帶練,學習為主,擺正心態
5 怎麼檢視XGBT的引數,他訓練出來的資料是什麼?
衡量模型在未知資料上的準確率,稱為泛化誤差。
方差衡量預測模型的穩定性。模型每次預測的結果變異 程度,預測結果是否接近。
偏差:精確性
2 split():函式
split():拆分字串。通過指定分隔符對字串進行切片,並返回分割後的字串列表(list)
str.split(sep, maxsplit).
sep 是分割符,不寫分割符時表示所有的空字元,包括空格、換行(\n)、製表符(\t)等,有分隔符時,以該分隔符進行分割;maxsplit是分割次數。
DataFrame用法
3.2 檢視資料
3.2.1 檢視資料Viewing Data
檢視資料三部曲:
head():檢視資料前幾項,看資料長什麼樣
info():檢視資料型別,以及資料缺失情況
descibe():檢視資料描述統計性資訊,資料大概分佈情況)
3.2.2 選取資料Selection
相關文章
- 大資料筆記01--大資料概述大資料筆記
- 大資料開發筆記大資料筆記
- 【工業大資料】工廠大資料之資料來源分析;如何挖掘並駕馭大資料的價值,成為“大資料企業”?大資料
- 筆記:大話資料結構筆記資料結構
- 大資料3.2 -- 實時筆記大資料筆記
- 大資料之 Hadoop學習筆記大資料Hadoop筆記
- 工業製造中的大資料分析大資料
- 軟工1作業筆記 20240420軟工筆記
- 用好工業大資料的基礎是資料質量大資料
- 【工業大資料】製造業大資料標準化應用及成功案例分析大資料
- 資料庫課程作業筆記資料庫筆記
- 【工業大資料】發展工業大資料,助力天津市先進製造研發基地建設大資料
- 大資料教程分享Actor學習筆記大資料筆記
- 2020畢業生就業大資料:IT行業平均薪資7839元就業大資料行業
- 大資料在工業製造企業的重要性大資料
- 資料庫課程作業筆記 - 編寫資料填充資料庫筆記
- 汽車工業協會:2020年2月汽車工業經濟執行資料
- 工信部:2020年1-9月工業機器人行業執行資料機器人行業
- 築夢2025工業大資料產業應用聯盟成立大資料產業
- 資料庫課程作業筆記 - 驗收資料庫筆記
- 實時工業大資料產品實踐——上汽集團資料湖大資料
- 工信部:將建2個公共工業雲平臺和1個工業大資料平臺大資料
- 工信部:2020年通訊業統計資料公報
- 2020-09-27【學習筆記】【企業資料湖】五、基於Apache Sqoop的批量資料獲取筆記ApacheOOP
- 工業大資料的關鍵技術是什麼大資料
- 工業大資料加速融合AI向智慧發展PUK大資料AI
- 工業大資料加速融合AI向智慧發展ZTXR大資料AI
- 大資料學習筆記500條【第一彈】,記得收藏!大資料筆記
- 資料競賽:第四屆工業大資料競賽-虛擬測量大資料
- 【大資料】中國工程院院士何友:工業大資料及其應用大資料
- 資料庫前端搭建學習筆記2020-12-16至資料庫前端筆記
- 資料互動筆記筆記
- 資料結構筆記資料結構筆記
- 慕課網10小時大資料入門筆記大資料筆記
- CDH5大資料實驗平臺搭建筆記H5大資料筆記
- 2020-09-23【學習筆記】【企業資料湖】三、Lambda架構:一種資料湖實現模式(1)筆記架構模式
- 【大資料】BigTable分散式資料儲存系統分散式資料庫 | 複習筆記大資料分散式資料庫筆記
- 大資料產業生態聯盟:2020中國大資料產業發展白皮書(附下載)大資料產業