R語言資料處理(一)
我這有兩個表:dim_match和dim_item,前者表示為使用者購買的商品集合,後者表示商品的類別屬性。
表dim_match:coll_id表示使用者id,這裡只有兩個使用者,i1-i3表示商品的id;
coll_id | i1 | i2 | i3 |
---|---|---|---|
1 | 002 | 00A | 00B |
2 | 00A | 00C |
表dim_item: item_id表示使用者id,cat_id表示商品類目;
item_id | cat_id |
---|---|
001 | N1 |
002 | N2 |
00A | A1 |
00B | A1 |
00C | A2 |
現在想通過dim_item表對dim_match表進行操作,把每個使用者購買的商品id替換為商品類目cat_id,即形成這樣的結果:
coll_id | i1 | i2 | i3 |
---|---|---|---|
1 | N2 | A1 | A1 |
2 | A1 | A2 |
程式碼如下:
coll_id= c(1,2)
i1 = c(‘002’,’00A’)
i2 = c(‘00A’,’00C’)
i3 = c(‘00B’,”)
dim_match<-data.frame(coll_id,i1,i2,i3)
item_id=c(‘001’,’002’,’00A’,’00B’,’00C’)
cat_id=c(‘N1’,’N2’,’A1’,’A1’,’A2’)
dim_item<-data.frame(item_id,cat_id)dim_match
coll_id i1 i2 i3
1 1 002 00A 00B
2 2 00A 00C
dim_item
item_id cat_id
1 001 N1
2 002 N2
3 00A A1
4 00B A1
5 00C A2x<-transform(dim_match,i1=dim_item[match(i1, dim_item[,1]),2],i2=dim_item[match(i2, dim_item[,1]),2],i3=dim_item[match(i3, dim_item[,1]),2])
x
coll_id i1 i2 i3
1 1 N2 A1 A1
2 2 A1 A2
相關文章
- r語言資料處理(三)R語言
- R語言資料處理(二)字元分隔R語言字元
- R語言歸一化處理R語言
- R缺失資料處理
- 資料處理的 9 大程式語言
- R語言批量建立資料框R語言
- 資料分析與R語言01R語言
- R語言資料質量分析R語言
- 自然語言處理背後的資料科學自然語言處理資料科學
- 9個最佳的大資料處理程式語言大資料
- R語言連線資料庫(MySQL)R語言資料庫MySql
- R語言入門與資料分析R語言
- 自然語言處理(NLP)系列(一)——自然語言理解(NLU)自然語言處理
- 語言處理器
- Python自然語言處理 1 語言處理與PythonPython自然語言處理
- R語言學習-高階資料管理R語言
- R語言:資料輸出至檔案R語言
- 自然語言處理(NLP)自然語言處理
- 用R處理不平衡的資料
- 【R語言入門】R語言中的變數與基本資料型別R語言變數資料型別
- C語言程式設計練習 GPS資料處理C語言程式設計
- r語言R語言
- R語言實戰(1) 資料集的建立R語言
- R語言批量提取excel當中的資料R語言Excel
- 《R語言入門與資料分析》——向量索引R語言索引
- Python自然語言處理 2 獲得文字語料和詞彙資源Python自然語言處理
- 【R語言入門】R語言環境搭建R語言
- 自然語言處理(NLP)概述自然語言處理
- 自然語言處理NLP(四)自然語言處理
- Python自然語言處理Python自然語言處理
- Go 語言異常處理Go
- 專業貼:100+個自然語言處理資料集自然語言處理
- 大資料處理需要用到的九種程式語言大資料
- 自然語言處理常用資源筆記分享自然語言處理筆記
- 有趣的自然語言處理資源集錦自然語言處理
- NLP 與 NLU:從語言理解到語言處理
- Python自然語言處理 3 處理原始文字Python自然語言處理
- 資料分析與挖掘 - R語言:KNN演算法R語言KNN演算法