我是資料分析師(三):跟Quick BI糾纏的日子裡不得不說的那些事
在幫老公用Quick BI做報表的過程中,一路走來,遇到不少問題,就像兩個人的感情在發展過程中,從陌生到熟悉,也會時而抓狂,時而驚喜,總結下那些不得不踩的坑,希望後來者可以繞過。
1、csv檔案編碼的問題真的很抓狂
一般支援本地檔案上傳的BI工具,像AWS的QuickSight,阿里雲的Quick BI都只支援UTF-8的編碼方式,非UTF-8上傳後會出現亂碼,這時就需要先做編碼轉化,而很多用csv、excel來做報表的人,是沒有技術背景的,做編碼轉化這件事情本身就非常蛋疼。
這個問題當時也讓我非常崩潰,我把excel另存為csv,再上傳到Quick BI,發現資料內容顯示亂碼,nnd,原來excel預設另存csv不是utf-8(我猜可能是GBK),甚至用sublime開啟都是亂碼,在sublime裡轉utf-8,發現還是亂碼,開發GG說用UltraEdit轉吧,可是我下載了UltraEdit在mac上卻一點開就閃退了,沒法用!什麼情況,瞬間感覺頭上多了3條線,還有無數只烏鴉從頭上飛過....
就這個亂碼的問題把我反覆來回折騰了好久,才終於把編碼格式轉換好,因此就給Quick BI提了個建議,問能否支援一些常用的編碼方式。
沒想到讓我驚喜的是,Quick BI目前已經支援了這個功能,一些常見的編碼方式都可以自動識別,再也不用到處找人幫忙做編碼轉換了,而且還支援excel上傳了,我連轉csv的操作都可以省掉了,這速度,不得不給Quick BI給大大的贊!
2、地圖出不來的問題真的很無奈
一般二維表的資料型別要麼是int、要麼是string,像省份、城市這種都是string型別,一開始我想做地圖圖表,卻發現怎麼地圖出不來,給了我個趨勢圖!這是什麼鬼
後來才知道,原來要先把省份轉換為地理緯度,這樣才會自動對映上地理位置資訊,出現地圖。好吧,這個是我的問題,怪不了別人。
切記、切記,如果想用地圖做地域分佈圖,先看看有沒有做地理緯度轉換,具體操作如下:
3、沒有轉換成日期格式的欄位,沒辦法作為日期控制元件進行查詢
這也是個坑啊,有些源表儲存日期時使用的是string型別,如果沒有做日期格式轉換,那麼就不能解析為日期,只能作為普通string的維度進行列舉查詢。
而當你需要用日期控制元件作為時間查詢時,就會發現,怎麼不能作為時間查詢!!
這時候,需要在資料集編輯頁面為該欄位選擇與源表欄位匹配的日期格式,就可以轉換為日期維度了。
我們可以看到,轉換後,左邊欄位型別的標識也變成了日期,然後便可在工作表編輯皮膚和製作儀表板時將該欄位作為時間來使用啦啦啦~~~
4、源表欄位變更非常煩啊
做報表過程中,最煩的就是當源表欄位變化時,有可能之前對資料集的操作會白費。這個問題曾經非常困擾我。
突然有一天發現原來Quick BI提供了同步表結構的功能,可以將源表新增的欄位同步至資料集,並且不改變對已有欄位的設定。
例如,我上週剛對銷售表sale_table(源表中只有data、id兩個欄位)建立了資料集cube1,並已經做了一些處理。而本週sale_table裡又新增了一個銷售區域欄位(sale_area)。這時候就無需重新對資料集進行操作了,只需在原有的資料集cube1上進行同步表結構,就能將sale_area欄位同步過來,且該同步操作不影響已有的其他表欄位的設定。如下圖所示:
需要注意的是:欄位變更會有以下兩種情況:
1)新增欄位,同步資料結構,對原有資料集不會有任何影響。
2)欄位名稱變更,比如將A欄位變更為AAA,那麼在同步資料集之後,你會發現資料集中A和AAA會同時存在,如果A欄位被使用或被查詢,則會報錯。這時候就需要把使用到A欄位的地方都替換成AAA,同時在資料集中把A刪掉。
5、資料集的分析與編輯傻傻分不清
不知道大家是否注意到資料集的右邊有分析、編輯兩種操作, 剛看到時我也有點懵...
後來就發現了編輯是對錶結構進行操作,如構建關聯模型、新建計算度量、同步表結構、新建鑽取、維度型別切換、度量設定聚合方式、度量格式化顯示等。
而資料集的分析則是在工作表中簡單地對資料進行過濾篩選,如設定日期條件、分類彙總、排序、求和等過濾條件。
需要注意的是,這兩個介面有點類似,如果先進入了分析介面,卻發現需要做多表關聯或者維度轉換,可以從工作表左上角進入資料集編輯介面進行操作。
暫時總結到這裡,後續有新的坑再繼續整理,希望能給苦逼的分析師們帶來一點幫助。如果遇到其他坑,也歡迎來討論討論。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/2157/viewspace-2807896/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 華為雲與鑑黃師不得不說的那些事
- 當移動資料分析需求遇到Quick BIUI
- 看京東架構師如何解決,資料庫讀寫分離與事務糾纏的坑架構資料庫
- 精細化運營不得不說的那些事兒
- 【Go】我與sync.Once的愛恨糾纏Go
- 我的2023--即將30歲的程式設計師,不得不說的那些怨念程式設計師
- TransmittableThreadLocal 的反覆與糾纏MITthread
- 開源二三事|ShardingSphere 與 Database Mesh 之間不得不說的那些事Database
- Kotlin與java的糾纏史KotlinJava
- Nature 子刊,糾纏資料有雙重效應,武大、北大「量子糾纏」研究新進展
- 關於程式碼評審(CodeReview)那些不得不說的事兒View
- 愛情刷不走三點鐘,區塊鏈裡也有“量子”“糾纏”區塊鏈
- bi資料分析工具中的鑽取分析是什麼?
- 做BI智慧資料分析,奧威BI系統是專業的
- 有什麼資料分析相關的事務是常規 BI 產品做不了的
- 說說Mongodb 與 MySQL的那些事MongoDBMySql
- 說說 VARCHAR 背後的那些事
- 大資料和雲端計算註定“糾纏不清”?大資料
- Quick BI支援哪些資料來源(配置操作篇)UI
- 我和Linux,不得不說的故事Linux
- 程式設計師前世今生之在大學的那些日子程式設計師
- 說說ITSM專案實戰那些事兒(三)
- 二分查詢不得不說的事
- 那些日子 三十
- 那些日子 九
- 那些日子 十
- 那些日子 十二
- 那些日子 十三
- 那些日子 十六
- 那些日子 十五
- 那些日子 六
- 說說RCE那些事兒
- 說說資料分析中的資料建模
- 資料採集與分析的那些事——從資料埋點到AB測試
- Web瀏覽器裡的那些事Web瀏覽器
- Java 資料庫連線的那些事Java資料庫
- 資料分析師到底是幹啥的?
- 說下我用Python分析美股財報的事Python