Spectrum Entropy Prediction Assisted Channel Selection for Secondary Users

marriii發表於2020-11-15
二次使用者頻譜熵預測輔助通道選擇

摘要
       為了解決頻譜瓶頸,減輕頻譜使用的不均衡,促進頻譜共享,設計了認知無線電(CR)網路。其中,通道的使用資訊對於CR節點至關重要,可以為更合適和更高效的通道訪問提供有效的參考資訊。
       頻譜預測有助於幫助CR節點尋求更好的訪問機會,從而提高CR節點的效能。 在本文中,我們首先簡要回顧了三種型別的頻譜預測。然後,我們提出了頻譜熵來測量通道接入穩定性,捕捉隨時間通道利用率的變化。此外,我們還設計了一個預測頻譜熵的混合模型。根據我們對現實世界頻譜資料進行的實驗表明,對頻譜熵的預測可以幫助城市地區的二次使用者(SUs)選擇擁有更足夠的可利用時間的通道。
 

介紹
          針對頻譜資源的稀缺性,CR技術是一種有效緩解了需求頻譜與供給頻譜差距的技術[1]。
       通道資訊對CR網路的效能至關重要。 在CR網路中,主使用者(PU)擁有授權通道。 一個SU只能借用授權通道,而不干擾PU。 一旦PU使用通道,SU必須停止通訊,並切換到新的可用通道,以恢復溝通。 但是,這種頻繁的通道交換帶來了嚴重的丟包、延遲和網路效能的惡化問題。 頻譜預測可以幫助SU選擇負載較輕或中等的通道,以降低通道轉換和傳輸中斷的概率。
       然而,現有的工作大多集中在通道狀態或利用率的預測[2-5]。 在相對較長的週期內準確預測通道狀態是極其困難的。而短期的通道狀態預測不足以滿足覆蓋SU對一個完整的空置通道的需求。
       並且,通道利用率無法衡量PU佔用通道的頻次。有些通道,雖然通道利用率低,但是PUS頻繁短訪問,顯然對於SU來說不是一個好的選擇,因為它會對SU造成太多的通訊中斷。 因此,有必要設計一種新的度量來描述通道的變化,這對於輔助SUS的通道選擇具有重要意義。
       預測通道穩定性有幾個挑戰。
  • 首先,原始頻譜資料包含隨機誤差和噪聲。因此,我們需要識別不同型別的誤差和噪聲,然後分別處理。
  • 第二,頻譜資料表現出非常複雜的時空變化。 因此,很難捕捉頻譜序列的特徵,建立預測模型。 採集得到的頻譜資料,形成的頻譜時間序列包含線性分量和非線性分量。
  • 自迴歸綜合移動平均模型(ARIMA)是線性時間序列中最流行的預測方法之一,但它很難捕捉非線性時間序列的特徵。 支援向量迴歸(SVR)等預測非線性時間序列的方法,由於頻譜資料嵌入的線性分量,並不太適合。 此外,不同PU使用者對應於不同波段的訪問行為差異很大。 建立一個達到高精度的通用預測模型是一個相當大的挑戰。
 
       在這些觀察的啟發下,本文重點研究了通道預測和對它通道訪問的選擇的提升。 首先,我們回顧了目前關於通道預測的研究進展。 然後,我們提出了一種新的頻譜熵來衡量未知通道是否佔用狀態的穩定性。我們證明,對頻譜熵的預測可以幫助SU選擇具有更好的穩定性的通道,以避免通道訪問的頻繁中斷。

通道預測方法
        頻譜利用率的預測對於設計和優化頻譜接入策略具有重要意義。 目前對頻譜預測的研究主要分為三大類:訊號強度、通道狀態和佔空比。
  • 對接收訊號強度的預測
        接收訊號強度(RSS)表示通道的總使用量。 [6-9]提出了各種線性方法來模擬RSS的變化。 
 
 
  • 在[6]中,使用了基於指數移動平均模型( the Exponential  Moving Average model )預測 頻譜的RSS(接受訊號強度) ,其中模型的加權因子隨資料時間呈指數下降。 該方法適用於有輕微變化的頻譜。
  • 在[7]中,作者採用二階自迴歸模型( the sec ond order Autoregressive Model )對RSS(接受號強度)進行建模。
  • 在[8]中,使用自迴歸移動平均模型( Auto-Regressive and Moving Average  model )來預測電視訊道的RSS接受訊號強度。
  • 在[9]中,對於非平穩時間序列,使用ARIMA模型來預測有效,因為它可以將非平穩RSS轉化為平穩時間序列。
  • 在[5]中,作者對多維頻譜資料進行建模,然後用卡爾曼預測演算法對RSS進行估計。
 
  • 對通道狀態的預測
  • 通道狀態是通道是否佔用的顯示。 大多數研究假設二進位制通道狀態是一個馬爾可夫過程,通道狀態變化基於泊松分佈【10】 因此,馬爾可夫模型經常被用來預測通道狀態[10]。 然而,一階馬爾可夫方法只能在大約55%的通道上實現明顯的效能改進,因為通道的行為不同(不符合馬爾可夫?) [11] 。
  • 機器學習方法在通道狀態預測中得到了研究[2-4]。其中, [2]應用小波神經網路對100-200M Hz波段的通道狀態進行預測。 基於頻域-時域相關性,採用頻繁模式挖掘方法預測通道可用性[3],採用長時記憶網路預測頻譜可用性[4]。
 
  • 對佔空比的預測
  • 佔空比表示通道的可用時間和繁忙比例,對通道選擇非常有幫助。 
  • 在 [12]中,作者開發並驗證了一基於能量檢測佔空比預測模型,以預測通道在任何地理位置的佔空比, 該方法基於平均噪聲功率和平均RSS(接收訊號強度)可以充分建模為高斯隨機變數的前提。
  • 在[13]中,應用距離因子遞迴最小二乘法預測多通道的繁忙概率。
  • 在[14]中,利用兩態的離散時間馬爾可夫鏈對頻譜佔空比變化進行建模。
 
       通道使用的預測受到了廣泛的關注,但對較長時間內頻譜利用率穩定性的研究仍然有待研究。 在本工作中,我們提出了一種衡量通道穩定性的度量方法和相應的預測方法。

頻譜熵計算
        為了避免頻繁的通訊中斷,SU更喜歡長時間不使用或空閒的通道。但是,隨機頻譜利用率導致頻繁的頻譜切換,從而降低了SU的傳輸效能。因此,有必要研究通道穩定性,這在以往被認為是不確定的。 夏農熵是衡量資訊不確定性或無序性的經典指標。 基本原理是,低概率事件/值的發生比高概率事件/值帶來更多的資訊。基於夏農熵,我們將譜的不確定性或穩定性定義為頻譜熵。 顯然,具有極高隨機性的頻譜使用表明了通道的不穩定。
 
        頻譜熵基於量化頻譜使用率,是一個離散的隨機時間序列來計算。 由於通道利用率範圍【0,1】 該區間均勻劃分為 L量化子區間。 給定通道i的量化通道利用率序列{ui(1)、ui(2)、...、ui(N)},通道i的頻譜熵計算公式為:
                                                                               
 
       其中N是資料樣本總數,nk是資料樣本數值為第k個量化子區間的數量。 此外,我們還應用了最小-最大歸一化方法( min-max normalization),該方法可以在歸一化後的預測中保持原始資料中的關係。
 

頻譜熵預測
 
        在圖1中所示。 頻譜熵預測由資料採集,資料預處理,特徵提取和預測模型四個部分組成。
                                   
 
       用頻譜監測裝置,首先採集感知訊號功率進行資料預處理。 資料清洗提高了實測訊號強度原始資料的質量,處理了冗餘、異常值和資料丟失。之後,將預處理後的資料轉化為歸一化譜熵。 然後,通過在預測中使用的特徵提取來探索嵌入在頻譜序列中的週期特徵。 最後,為了幫助提高通道接入的穩定性,可以用所提出的混合預測模型估計頻譜熵。
 

資料預處理
       我們使用一個自行開發的行動式裝置收集頻譜資料,該裝置測量頻譜的RSS(接受訊號強度)。 所監測的頻譜涵蓋六個廣泛使用的頻帶,共有263個通道,由相應模組 並行掃描,包括
  • 315MHz(300MHz∼348M Hz)
  • 433MHz(387MHz∼463.8M Hz)
  • 470MHz(471.25MHz∼509.75M Hz)
  • CDMA(上行鏈路:826.11MHz∼833.49MHz;下行鏈路:871.11MHz∼878.49MHz)
  • GSM(上行鏈路:885.2MHz∼909MHz;下行鏈路:948.9MHz∼959.7MHz)
  • 2.4G Hz(2412MHz∼2472MHz)。
        掃描速率分別為8.5ms、7.1ms、7.5ms、11.4ms、9.35ms和6.5ms。每個波段按標準分為多通道。 在315MHz和433MHz頻段通道頻寬為1.6MHz。 在470MHz、CDMA和2.4GHz波段的每個通道分別佔用1.5MHz、1.23MHz和5MHz。GSM頻段的上行和下行通道佔用頻寬分別為0.2MHz和0.4MHz。 採集資料的取樣率為5Hz。
       對於收集到的資料,有一些型別的錯誤根據它們的屬性分別處理。
 
冗餘資料:
       在同一時刻為一個通道生成兩個相同的記錄。 重複可能是由於感測或儲存模組的製造不完善或一些外部因素造成的。 同一頻道一次只保留一條記錄。
 
離群值:
       離群值可能是由於模組的瞬態故障或特殊事件的發生引起的。 首先用Zscore來仔細檢查異常值,異常值是遠離資料平均值的標準差數。
       由於無線環境的動態和不可預測,很難將離群值或錯誤與可能包含重要資訊的意外通訊事件引起的訊號變化區分開來。 意外的強訊號通常持續很短的時間。 此外,極短的強訊號只對頻譜熵的預測有輕微的影響。 因此,我們進一步分開持久出現的離群值,只有在一定持續時間記憶體在的強訊號才被認為是一個特殊的事件。 其他情況,都不認為是錯誤。通訊會話建立的時間或持續時間因通訊協議的不同而不同。在我們的實驗中, 永續性時間被設定為0.5秒,這在CR網路或移動和自組網上的一些論文中已經使用過。
 
缺失資料:
        缺失資料可能是在儲存過程中沒有記錄資料,或者感測模組沒有收集資料。 有兩種缺失的資料,即短期資料損失按秒級和長期資料損失超過分鐘。 對於短期資料丟失,缺失的資料用前面四個資料樣本的平均值填充。 這些樣本高度相關,很少突然變化。 為了解決長期資料丟失的問題,我們建立了一個高斯模型,該模型基於與資料丟失的一天前後相同時段的資料。 然後用高斯模型生成的資料樣本對丟失的資料進行模擬。 由於相關性衰減與24小時的時差如圖2所示,所以使用相鄰天數的資料來幫助恢復丟失的資料。 
                                        
 
       在資料清洗和恢復後,通過將每次測量的RSS(接收訊號強度)與功率閾值進行比較,確定通道狀態為空閒或繁忙,根據噪聲基準測量,功率閾值為-100dbm。 此外,通道利用率是通過對每個通道T個通道狀態的平均來計算的。 在有了通道的使用率之後,根據得到的利用率序列每個小時計算一些頻譜熵。

特徵提取:
        如果頻譜資料是獨立分佈的,就不可能利用歷史資訊建立預測模型。 自相關序列顯示了資料中的迴圈特徵。 為了保證預測的可行性,我們用以下係數研究了頻譜熵的時間序列中的自相關性。 這裡h(m)是長度為M的頻譜熵。
 
                                                              
       圖2顯示了433MHz和GSM波段的自相關作為一個例子。 頻譜熵中可以觀察到強正自相關。 自相關每24小時達到區域性最大值,然後隨時間逐漸衰減。 不同的頻帶在自相關中表現出相似的模式,儘管區域性最大延遲值在不同的週期,但是大部分是自相關延遲為24。 作為一個重要特徵,和區域性最大值有關的自相關延遲被採用。
                                                           

混合預測模型  
        從現場實驗中收集到的頻譜序列是複雜的,包括線性分量和非線性分量。 為每個波段甚至每個通道建立一個單獨的模型可以達到最優的效能,但考慮到頻譜的寬範,這種想法需要建許多模,並且不方便在寬頻譜上進行預測。為了使用一個通用的框架來解決問題,以方便對整個頻譜進行預測,我們用線性和非線性模型來捕獲隨機和連續的特徵。 然後用資料分別對每個波段的模型引數進行訓練 ,以達到較高的預測精度。
         這樣,我們就可以建立一個通用模型,該模型可以用針對每個波段的引數來捕獲特徵。 ARIMA是線性時間序列中最流行的預測方法之一,但是,它很難捕捉非線性時間序列的特徵。 所以,一方面,我們在混合模型中加入ARIMA來處理頻譜序列中的線性分量。 神經網路和支援向量機是預測非線性時間序列的常用方法。 神經網路是基於經驗風險最小化實現的,可能陷入區域性最優。 SVR模型採用結構風險最小化原則,來最小化泛化誤差。 因此,SVR模型在建立非線性模型方面是有效的,可以達到全域性最優。 將SVR模型納入我們的混合預測模型中,以達到較高的預測精度。
                                  
        我們提出的混合預測方法 ARIMA_PSO_SVR,如圖三所示,預測結果 , 其中X^表示ARIMA的初步結果; E=H-X^是ARIMA和原始譜熵預測的差異。 首先,用ARIMA處理預處理的資料,處理譜熵的線性分量,得到初步的預測結果。 殘差E包含頻譜熵的非線性分量。然後,SVR方法預測殘差分量,圖2中的自相關,顯示其24小時的週期性相關性。 因此,我們在SVR模型中對所有波段使用維數為24的殘差E矩陣。 對於SVR模型,我們選擇高斯核,因為可以在相應的特徵空間中構造線性迴歸函式。 SVR的預測效能在很大程度上取決於引數,即正則化引數和高斯核的寬度。 我們使用粒子群優化(PSO)演算法來尋求SVR引數的良好組合。 通過模擬鳥群行為,粒子在尋找最優解時交換位置,所有粒子都向更好位置移動。 最終,粒子群將收斂到最佳位置。 只優化幾個引數,方便實現PSO。 
        使用 預測結果的均方誤差函式用於評估SVR預測效能的PSO適應度函式。 因此,我們可以根據頻譜熵資料為模型尋找合適的引數。
        在輸入資料為E(T)=(e(t-24)、e(t-23)、...、e(t-1))、t>24的情況下,PSO_SVR模型的預測結果E^=(e^(25)、e^(26)、...、e^(n))為
其中b是偏置項,bi和b*是拉格朗日乘子。
       有n個由E(I)表示的支援向量。ε,ζ和σ 分別表示高斯核的公差引數、鬆弛變數和寬度。 最終結果是ARIMA和SVR模型預測結果的總和。 最終結果是ARIMA和SVR模式的預測結果之和。

實驗頻譜資料集
        這個接受訊號強度(RSS)收集在位於中國深圳的一個住宅區,涵蓋六個波段,共計263個通道。 2013年7月22日至9月22日進行了測量。 每個頻道在一天內收集了432000個資料條目。因此,單日資料集包含432000*263=113616000條記錄。 每小時計算頻譜熵。 頻譜熵的整個資料集平均分為兩個子集,一個子集用於訓練,另一個子集用於測試。
 
預測精度
        我們將所提出的方法與ARIMA、Grid_SVR和PSO_SVR進行了比較。其中Gird_SVR方法,通過網格搜尋實現了引數最優。 粒子數從100到200不等,以求複雜問題的最優解。以下為一些引數設定:
  • 根據實驗,在大多數情況下,經過300到600次迭代,可以得到最優解。 為了防止過早搜尋過程,我們將迭代次數設定為800次。
  • 在ARIMA中,引數包括差異程度、自迴歸順序和分別設定為[0,2,1,5]和[0,5]的移動平均項。
  • SVR引數是正則化引數、高斯核寬度和容差引數,其範圍因頻帶而異。
        此外,我們還研究了與其他三種方法中達到最佳預測精度的模型相比,我們的模型的改進,如表1所示。
                                   
  • 對於這六個波段,所提出的ARIMA_PSO_SVR模型與ARIMA、Grid_SVR和PSO_SVR相比,平均預測精度分別提高了46.35%、43.98%和32.86。 歸一化後的平均絕對誤差.
  • 我們的模型在470兆赫波段獲得了44.93%的最高改進,這是用來提供電視服務的頻段。 這個波段的利用率變化緩慢,主要是一個確定性的成分。 更精確的模型導致更高的精度提升。
  • 該方法在CDMA、GSM和2.4GHz頻段的預測中實現了小於30%的改進。 其根本原因可能是由於與其他三個頻段相比,這幾個頻段存在大量潛在使用者的隨機訪問行為。
        結果表明,單一的線性或非線性預測模型很難準確地捕獲複雜的頻譜資料,因此對現實世界的頻譜資料來說,混合模型是必要的。

穩定性改進
        預測頻譜熵的分佈如圖4所示,它包括了470MHz和CDMA頻段,時長兩週的資料。 藍線表示相同通道利用率下不同頻譜熵。 這條線清楚地表明,利用率為0.1的通道在頻譜熵上可能有很大的變化。 因此,單靠通道利用率不足以決定選擇哪個通道接入。
                                   
       為了評價不同通道選擇準則的效能,我們計算了通道空閒的持續時間,即通道在一小時內的可用週期之和。 當利用率高於0.5%時,假設通道太忙,不適合機會訪問。因此,我們只計算利用率小於0.5的通道的可用週期。 從0到0.5,利用率平均分為五級。 然後根據通道的利用率將通道分為五組。 我們計算通道可用次數,即所選通道可供SU在一小時內的使用次數。 然後,計算每個組的通道可用的平均持續時間。
        我們的方法和僅僅採用利用率的方法,所選通道的平均、最壞和最佳可用時間如圖5所示。
                                    
        對於這五組,我們的方法和僅依賴利用率的方法分別達到最佳可用時間55.8分鐘和46.4分鐘,最差可用時間39.8分鐘和32分鐘。 與僅基於通道利用率的通道選擇相比,該方法平均可提高通道可用時間22.57%。 結果表明,我們方法的提升隨著通道利用率的提高而提高。換句話說,所提出的方法在第5組通道的可用時間上達到了37.84%的最高改善,第五組的利用率在[0.4,0.5]。這兩種方法都獲得了第1組中通道的完整通道可用時間60分鐘。 其根本原因是,當通道利用率很低時,這兩種演算法都可以很容易地找到SU的理想通道。 當通道負載適中時,我們的演算法比基於利用率的演算法具有優勢,這證明了它在一般實際場景中的有效性。
         目前CR網路的接入方案一般是根據通道利用率來選擇通道。 然而,相同通道利用率的通道之間供SU使用的效能差異很大,因為通道經常被PU回收的頻率不一樣。從這個意義上說,通道可用性時間結束。 因此,低利用率和穩定性高的通道更有利於SU,因為它可以支援更長時間的訊號傳輸。 而我們所提出的頻譜熵可以用來測量通道穩定性。因此,選擇基於頻譜熵和通道利用率的預測通道可以提高通訊鏈路的壽命。

結論和未來的工作
         針對 opportunistic channel  access 所必需的精確通道狀態預測,我們提出了頻譜熵作為一種新的度量來衡量通道狀態的變化頻率。通過頻譜熵預測,SU可以找到一個具有穩定訪問許可權的通道,以減少通道切換或傳輸中斷。由於我們發現採集到的頻譜資料的複雜性質,提出了PSO_SVR ARIMA_混合預測模型來處理頻譜資料的線性和非線性分量。一個基於六個波段的現場測量資料的實驗表明,ARIMA_PSO_SVR可以平均提高41.62%以上的預測精度。此外,基於頻譜熵預測和通道利用率的通道選擇選擇選擇了穩定性最高的通道,平均提高了22.57%通道接入時間。
         在目前的工作中,我們只關注從一個裝置收集的資料,而來自多個裝置的資料可能會導致更多的發現。 我們將進一步研究覆蓋不同功能區的更多裝置和移動感測得到的資料。 此外,我們還從平穩CR網路的角度研究了頻譜的穩定性。研究我們的預測模型在移動CR網路的提升及其效果將是非常有趣的。

工作得到了授予JCYJ20170818163403748的深圳基礎研究計劃和深圳城市計算和資料智慧學科建設專案的支援。 黃的工作得到了NSFC-廣東聯合計劃資助U1501255和廣東青年創新人才專項支援計劃資助2016TQ03X279。

相關文章