閱讀文獻《DCRNet:Dilated Convolution based CSI Feedback Compression for Massive MIMO Systems》

tanyuyang發表於2023-04-28

這篇文章的作者是廣州大學的範立生老師和他的學生湯舜璞,於2022年10月發表在 IEEE TRANSACTIONS ON VEHICULAR TECHNOLOGY。

文獻提出了一種基於空洞卷積(Dilated Convolution)的CSI反饋網路,即空洞通道重建網路(Dilated Channel Reconstruction Network, DCRNet)。還設計了編碼器和解碼器塊,提高了重建效能並降低計算複雜度。

1 研究背景

在下行MIMO系統中,利用通道狀態資訊(CSI)是BS完成預編碼設計的前提。在時分雙工(TDD)模式下,由於通道的互易性,BS可以直接獲得下行鏈路的CSI。然而在頻分雙工(FDD)模式下,因為BS由於弱互易而難以獲得CSI資訊,下行鏈路的CSI必須由UE來估計。但在大規模MIMO系統中,反饋CSI矩陣的開銷隨著天線數量的增加而增加,也受到使用者的發射功率和上行頻寬的限制。因此,需要對反饋CSI進行壓縮。

傳統基於CS的方法如LASSO和BM3D-AMP演算法等存在一些侷限性,如假設CSI是理想稀疏的,在隨機工程中忽略了通道統計,迭代處理導致了較大的延遲等。

基於深度學習的方法如CsiNet等,優於傳統的基於CS的演算法,而且可以有效地減小網路引數。這類演算法的主要限制是網路架構不能提供足夠的感受野(receptive field, RecF)*,表明深層神經元不能表示原始輸入的足夠區域。為了克服這種限制,一些論文提出了設計更大的RecF以增加摺積大小來提高CSI重建效能,代價是增加網路的複雜度。因此,設計一種輕量級的網路架構,在較低計算複雜度下提高RecF的同時,又能保持CSI重構的效能,是非常重要的。

文章的主要貢獻有:

  • 提出了一種基於擴充套件卷積的CSI反饋網路DCRNet,該網路在有效壓縮CSI反饋的同時降低了計算複雜度;
  • 在不增加摺積大小的情況下,利用擴充套件卷積增強RecF網路,重新設計了一種先進的編碼器和解碼器塊,以提高重構效能,降低計算複雜度。

*感受野:CNN中每一層輸出的特徵圖上的畫素點對映回輸入影像上的區域大小。通俗點的解釋是,特徵圖上一點,相對於原圖的大小,也是卷積神經網路特徵所能看到輸入影像的區域。

2 CSI反饋系統

考慮頻分雙工MIMO下行鏈路,在BS上有\(Nt>>1\)根天線,在每個UE上有1根天線,在OFDM中有\({N}_{\mathrm{c}}\)個子載波,第n個子載波的復值接收訊號為:

\[y_n={\mathbf{h}}_n^H \mathbf{b}_n x_n+z_n, \]

\({\mathbf{h}}_n \in \mathbb{C}^{N_{\mathrm{t}} \times 1}, (·)^H,\mathbf{b}_n \in \mathbb{C}^{N_{\mathrm{t}} \times 1}, x_n \in \mathbb{C} \text {, 和 } z_n \in \mathbb{C}\)分別表示第\(n\)個子載波上的通道增益向量、共軛轉置、波束成形向量、發射訊號和加性高斯白噪聲(AWGN)。所有子載波的CSI可表示為矩陣\({\mathbf{H}}=\left[{\mathbf{h}}_1, {\mathbf{h}}_2, \ldots, {\mathbf{h}}_{{N}_c}\right] \in \mathbb{C}^{N_t \times {N}_c}\),其中共有\(2N_cN_t\)個元素。

BS的波束形成和預編碼設計需要CSI矩陣H的反饋,但MIMO的天線數量導致巨大的開銷。為了解決這個問題,需要將CSI矩陣H壓縮後再反饋給BS,CSI反饋模型如圖1所示。

圖1 CSI反饋結構

CSI矩陣H首先透過離散傅立葉變換(DFT)從空間域和頻域變換到角域和延遲域,即:

\[\tilde{H}=F_cHF_t^H, \]

其中,\(F_c,F_t\)分別為\(Nc × Nc\)和$Nt × Nt \(的DFT變換矩陣。由於多徑到達有延遲區間,矩陣\)\tilde{H}\(在角延遲域中是稀疏的,它可以分為兩部分,一部分是\)H_a\(,其中有\)N_a\(行由非零元素組成(\)N_a < N_c\(),另一部分其餘\)N_c−N_a\(行由近零元素組成。把通道矩陣\)H\(壓縮為\)H_a$,而且資訊損失可以忽略不計。

為了進一步壓縮CSI矩陣,還要應用基於深度學習的自編碼壓縮和恢復模組,如圖1所示,透過編碼器壓縮CSI矩陣輸出較小的碼字向量:

\[\begin{align*} \boldsymbol{v}=\mathcal {E}(\theta _{1},\boldsymbol{H}_{\boldsymbol{a}}), \tag{3} \end{align*} \]

其中,\(\mathcal {E}(·)\)代表壓縮操作,\(\theta_1\)代表編碼器的引數。壓縮後的CSI矩陣透過專用的通道反饋給BS,然後BS透過解碼器恢復CSI矩陣:

\[\begin{align*} \hat{\boldsymbol{H}}_{\boldsymbol{a}}=\mathcal {D}(\theta _{2},\boldsymbol{v}), \tag{4} \end{align*} \]

其中,\(\mathcal {D}(·)\)代表壓縮操作,\(\theta_2\)代表解碼器的引數。CSI反饋的目的是為了最小化平均重構誤差:

\[\begin{align*} \min _{(\theta _{1},\theta _{2})} \mathbb {E}||\boldsymbol{H}_{\boldsymbol{a}}-\hat{\boldsymbol{H}}_{\boldsymbol{a}}||_{2}, \tag{5} \end{align*} \]

3 基於空洞卷積的CSI反饋

3.1 DCRNet的結構

基於卷積神經網路的自編碼器可以有效地提取CSI矩陣的空間區域性相關性,基於空洞卷積的DCRNet結構如圖2所示。

圖2 DCRNet的網路結構

在(a)編碼器中,輸入\(H_a\)的維度為\(2×N_a×N_t\),兩個獨立的通道分別代表CSI矩陣的實部和虛部,首先使用5×5的頭卷積來提取和融合CSI矩陣實部和虛部的特徵資訊;然後透過一個編碼塊來提取深度的抽象資訊,與ACRNet不同,為了減少複雜度, DCRNet 中的編碼器只需要一個單元就可以得到17 × 17的 RecF,只比ACRNet中RecF的小一點;隨後利用全連線層來把\(2×N_a×N_t\)的矩陣壓縮成一維的碼字向量,壓縮比\(\mathcal {η}∈(0,1)\);最後碼字透過無線通道傳輸到BS的解碼器。

在(b)解碼器中,輸入碼字經過全連線層進行重塑操作;隨後5×5的頭卷積用來增強通道恢復效能;之後兩個空洞卷積解壓塊來恢復壓縮的資訊。其中批歸一化和引數整流線性單元(parametric rectified linear unit,PReLU)啟用函式應用到每一層卷積之中,帶有可學習引數\(α\)的PReLU為:

\[\begin{align*} \text{PReLU}(x)=\left\lbrace \begin{array}{ll}x, & x \geq 0 \\ \alpha x, & x< 0. \end{array}\right. \tag{6} \end{align*} \]

3.2 空洞編碼解碼塊的設計

與傳統卷積不同,空洞卷積帶有特定的間隔\(d\),也稱作空洞率。二維空洞卷積運算可以寫作:

\[\begin{align*} (\boldsymbol{I}\circledast \boldsymbol{K})[i,j]=\sum _{u}\sum _{v} {\boldsymbol{I}[i+du,j+dv]\cdot \boldsymbol{K}[u,v]}, \tag{7} \end{align*} \]

其中\(\circledast,\boldsymbol{I},\boldsymbol{K}\)分別表示空洞卷積操作、二維輸入和卷積核,\(u,v\)為卷積核\(\boldsymbol{K}\)的指數,空洞率為\(d\)的空洞卷積有效卷積核大小表示為:

\[\begin{align*} k_{i}^{\prime }=k_{i}+(k_{i}-1)(d-1), \tag{8} \end{align*} \]

其中\(k_i,{k^{'}}_i\)為當前使用的卷積核大小和有效的卷積核大小。圖3展示了空洞率不同的空洞卷積,在同樣的卷積核大小下,當\(d>1\)時,空洞卷積比普通卷積能夠提供更大的感受野,可以實現塊稀疏CSI矩陣的稀疏取樣。

圖3 空洞率為1、2、3時的空洞卷積

1)編碼塊設計

雖然隨著空洞率的增加RecF會變大,但連續使用相同空洞率的空洞卷積會造成網格效應和資訊損失。根據混合空洞卷積和非對稱卷積技術,在編碼器塊中採用了d = 1、d = 2和d = 3的非對稱3×3卷積,如圖2所示。可以驗證編碼塊可以獲得大小為13 × 13的RecF,等於CsiNet+的大小。這不僅可以幫助編碼塊提取大規模資訊,關注區域性細節而不產生網格效應,還可以降低計算複雜度。

由於連線不同卷積的特徵可以產生CSI的多解析度以提高系統效能,因此對編碼塊執行連線操作,如圖2(c)所示。採用標準3 × 3濾波器作為空洞卷積的補充,編碼塊的輸入將透過兩個並行分支,一個是空洞卷積,另一個是標準3 × 3卷積。然後將它們的輸出進行連線,透過1 × 1卷積將通道數量減少到2。最後根據殘差學習的思想,使編碼塊的輸入新增到1 × 1卷積的輸出中。

2)解碼塊設計

在圖2(d)中,與編碼塊的設計原則類似,在第一個分支中,使用d = 2的3 × 3空洞卷積將特徵維數增加到\(8ρ\),其中\(ρ≥1\)為網路寬度擴充套件率。透過調整擴充套件率\(ρ\),可以使DCRNet-\(ρ\) x適用於不同計算能力的模組,然後使用3×1和1×3且d=3的空洞卷積代替標準9×9的卷積,可以有效的減少計算複雜度。隨後使用3×3的卷積來減少特徵通道數到2。

在第二個分支中,不像在編碼塊中只使用一個標準卷積,這裡使用了分組卷積和寬度擴充套件運算,因為BS的計算資源不像UE是有限的,而且寬度擴充套件運算對於CSI反饋同樣重要。其中,1 × 3和3 × 1濾波器分別用於增加和減少特徵維數,5 × 1和1 × 5分組卷積作用與第一個分支中的相似。兩個分支的輸出將被連線在一起,並透過1 × 1的卷積。

由於使用了空洞卷積和多解析度思想,DCRNet比ACRNet的感受野寬得多,而且FLOPs更低,在效能和計算複雜度之間取得了很好的平衡。

4 實驗結果分析

4.1 實驗設定

1)資料

根據COST2100實現室內5.3GHz和室外300MHz的訓練和測試場景,BS處有\(N_t=32\)個均勻線性天線陣列和\(N_c=1024\)個子載波,原始大小為\(2×32×1024\)的CSI矩陣在轉換到角延遲域處理之後,得到\(2×32×32\)的CSI矩陣,訓練集、驗證集和測試集分別為100000、30000和20000。

2)訓練

使用Kaiming initialization來產生每個卷積層和全連線層的權重,還採用了餘弦退火學習率來增強網路效能,初始學習率的範圍在\(\gamma _{min}=5×10^{-5}\)\(\gamma _{max}=2×10^{-3}\)之間,學習率可以表示為:

\[\begin{align*} \gamma _{t} =\gamma _{min}+\frac{1}{2}(\gamma _{max}-\gamma _{min})\left(1+\cos \left({\frac{t-T_{w}}{T-T_{w}}\pi }\right)\right), \tag{9} \end{align*} \]

其中,\(t\)是第\(t\)個訓練時期,\(γ_t\)是當前的學習率,\(T_w\)\(T\)分別是預熱時期和總時期的數量,分別設定為30和2500。

3)評估標準

使用歸一化均方誤差(NMSE)來評估輸入CSI矩陣\({\boldsymbol{H}_{\boldsymbol{a}}}\)和輸出CSI矩陣\(\hat{\boldsymbol{H}_{\boldsymbol{a}}}\)的區別,由下式給出:

\[\text{NMSE}=\mathbb {E}\left\lbrace {\left\Vert \boldsymbol{H}_{\boldsymbol{a}}-\hat{\boldsymbol{H}_{\boldsymbol{a}}}\right\Vert _{2}^{2}}\Big/{\left\Vert \boldsymbol{H}_{\boldsymbol{a}}\right\Vert _{2}^{2}}\right\rbrace, \]

4.2 DCRnet的效能

將DCRNet與基於DL的CSI反饋網路進行比較,分為低複雜度網路組:CsiNet、CRNet、ACRNet和DCRNet,和高複雜度且高效能組:DCRNet10×、DS-NLCsiNet、SOTA CsiNet+和ACRNet10×。

表1列出了上述幾種CSI反饋網路的效能比較,其中壓縮率\(η\)分別設定為1/4、1/8、1/16和1/32,最佳結果以粗體顯示。從表1中,可以發現DCRNet-1×具有最低的計算複雜度和最少的引數,而且可以在室內場景下實現了不同壓縮率下的SOTA效能,在室外場景下,DCRNet-1×仍然可以以最低的FLOP實現幾乎相同的SOTA效能。

表1 不同網路的NMSE比較

5 結論

文獻提出了DCRNet,網路採用空洞卷積來增加RecF,同時降低計算複雜度。模擬結果表明了DCRNet1×在計算資源有限的情況下優於其它輕量級網路,而且DCRNet-10×以比傳統網路低得多的計算複雜度實現了幾乎相同的重建效能。

相關文章