課程介紹
R是免費的,R是一個全面的統計研究平臺,提供了各式各樣的資料分析技術,R擁有頂尖的繪圖功能
1-9 資料分析的內容,學習R的目的
10-15 R的基本操作
16-17 R的資料結構和操作,最基礎最重要
28-33 R對檔案的操作
資料分析
資料是指對客觀事件進行記錄並可以鑑別的符號,是對客觀事物的性質,狀態以及相互關係等進行記載的物理符號或這些物理符號的組合
進行資料分析是為了透過資料分析的結果來指導決策
資料分析的過程:資料採集,資料儲存,資料分析,資料探勘,資料視覺化,進行決策
資料採集的資料稱為後設資料
資料統計:使用統計方法,有目的的對收集到的資料進行分析處理,並解讀分析結果
資料探勘:一般是指從大量的資料中透過演算法搜素隱藏於其中資訊的過程
均值,中位數,極差,方差,標準差,偏度,峰度,出現最頻繁的數
資料探勘
資料與三個重大的思維轉變:
- 要分析與某事物相關的所有資料而不是依靠分析少量的資料樣本
- 我們樂於接收資料的紛繁複雜,而不再追求精確性
- 不再探求難以捉摸的因果關係,轉而關注事物的相關關係
資料視覺化
R語言介紹
R是S語言的一種實現。S語言是由AT&T貝爾實驗室開發的一種用來進行資料探索、統計分析、作圖的解釋型語言。最初S語言的實現版本主要是S-PLUS。S-PLUS是一個商業軟體,它基於S語言,並由 MathSoft公司的統計科學部進一步完善。後來Auckland大學的 RobertGentleman 和 Ross lhaka 及其他志願人員開發了一個R系統。R的使用與S-PLUS有很多類似之處,兩個軟體有一定的相容性。
- 有效的資料處理和儲存機制。
- 擁有一整套陣列和矩陣的操作運算子。
- 一系列連貫而又完整的資料分析中間工具
- 圖形統計可以對資料直接進行分析和顯示,可用於多種圖形裝置
- 一種相當完善、簡潔和高效的程式設計語言。
- R語言是徹底物件導向的統計程式語言。
- R語言和其它程式語言、資料庫之間有很好的介面,
- R語言是自由軟體,可以放心大膽地使用,但其功能卻不比任何其它同類軟體差。
- R語言具有豐富的網上資源。
1、R軟體不夠規範,不容易上手,需要付出較多的努力,付出大量的學習成本;
2、R擴充套件包,太多了,需要利用較多的時間查詢和學習
R可以進行計算,繪圖,也是一個程式語言,
r-project.org
舉個例子
R軟體的安裝
2024年4月20日18:54:24