用Excel做資料分析――迴歸分析

clown_發表於2016-09-27

  例項 某溶液濃度正比對應於色譜儀器中的峰面積,現欲建立不同濃度下對應峰面積的標準曲線以供測試未知樣品的實際濃度。已知8組對應資料,建立標準曲線,並且對此曲線進行評價,給出殘差等分析資料。

  這是一個很典型的線性擬合問題,手工計算就是採用最小二乘法求出擬合直線的待定引數,同時可以得出R的值,也就是相關係數的大小。在excel中,可以採用先繪圖再新增趨勢線的方法完成前兩步的要求。

  選擇成對的資料列,將它們使用“X、Y散點圖”製成散點圖。

用Excel做資料分析——迴歸分析 三聯

  在資料點上單擊右鍵,選擇“新增趨勢線”-“線性”,並在選項標籤中要求給出公式和相關係數等,可以得到擬合的直線。

  由圖中可知,擬合的直線是y=15620x+6606.1,R2的值為0.9994。

  因為R2 >0.99,所以這是一個線性特徵非常明顯的實驗模型,即說明擬合直線能夠以大於99.99%地解釋、涵蓋了實測資料,具有很好的一般性,可以作為標準工作曲線用於其他未知濃度溶液的測量。

  為了進一步使用更多的指標來描述這一個模型,我們使用資料分析中的“迴歸”工具來詳細分析這組資料。

  在選項卡中顯然詳細多了,注意選擇X、Y對應的資料列。“常數為零”就是指明該模型是嚴格的正比例模型,本例確實是這樣,因為在濃度為零時相應峰面積肯定為零。先前得出的迴歸方程雖然擬合程度相當高,但是在x=0時,仍然有對應的數值,這顯然是一個可笑的結論。所以我們選擇“常數為零”。

  “迴歸”工具為我們提供了三張圖,分別是殘差圖、線性擬合圖和正態機率圖。重點來看殘差圖和線性擬合圖。

  線上性擬合圖中可以看到,不但有根據要求生成的資料點,而且還有經過擬和處理的預測資料點,擬合直線的引數會在資料表格中詳細顯示。本例項旨在提供更多資訊以起到拋磚引玉的作用,由於涉及到過多的專業術語,請各位讀者根據實際,在具體使用中另行參考各項引數,此不再對更多細節作進一步解釋。

  殘差圖是有關於世紀之與預測值之間差距的圖表,如果殘差圖中的散點在中州上下兩側零亂分佈,那麼擬合直線就是合理的,否則就需要重新處理。

  更多的資訊在生成的表格中,詳細的引數專案完全可以滿足迴歸分析的各項要求。下圖提供的是擬合直線的得迴歸分析中方差、標準差等各項資訊。

相關文章