閱讀文獻《DCRNet：Dilated Convolution based CSI Feedback Compression for Massive MIMO Systems》

tanyuyang發表於2023-04-28

原文網址 : https://www.cnblogs.com/tanyuyang/p/17362660.html

這篇文章的作者是廣州大學的範立生老師和他的學生湯舜璞，於2022年10月發表在 IEEE TRANSACTIONS ON VEHICULAR TECHNOLOGY。

文獻提出了一種基於空洞卷積（Dilated Convolution）的CSI反饋網路，即空洞通道重建網路(Dilated Channel Reconstruction Network, DCRNet)。還設計了編碼器和解碼器塊，提高了重建效能並降低計算複雜度。

1 研究背景

在下行MIMO系統中，利用通道狀態資訊(CSI)是BS完成預編碼設計的前提。在時分雙工(TDD)模式下，由於通道的互易性，BS可以直接獲得下行鏈路的CSI。然而在頻分雙工(FDD)模式下，因為BS由於弱互易而難以獲得CSI資訊，下行鏈路的CSI必須由UE來估計。但在大規模MIMO系統中，反饋CSI矩陣的開銷隨著天線數量的增加而增加，也受到使用者的發射功率和上行頻寬的限制。因此，需要對反饋CSI進行壓縮。

傳統基於CS的方法如LASSO和BM3D-AMP演算法等存在一些侷限性，如假設CSI是理想稀疏的，在隨機工程中忽略了通道統計，迭代處理導致了較大的延遲等。

基於深度學習的方法如CsiNet等，優於傳統的基於CS的演算法，而且可以有效地減小網路引數。這類演算法的主要限制是網路架構不能提供足夠的感受野(receptive field, RecF)*，表明深層神經元不能表示原始輸入的足夠區域。為了克服這種限制，一些論文提出了設計更大的RecF以增加摺積大小來提高CSI重建效能，代價是增加網路的複雜度。因此，設計一種輕量級的網路架構，在較低計算複雜度下提高RecF的同時，又能保持CSI重構的效能，是非常重要的。

文章的主要貢獻有：

提出了一種基於擴充套件卷積的CSI反饋網路DCRNet，該網路在有效壓縮CSI反饋的同時降低了計算複雜度；
在不增加摺積大小的情況下，利用擴充套件卷積增強RecF網路，重新設計了一種先進的編碼器和解碼器塊，以提高重構效能，降低計算複雜度。

*感受野：CNN中每一層輸出的特徵圖上的畫素點對映回輸入影像上的區域大小。通俗點的解釋是，特徵圖上一點，相對於原圖的大小，也是卷積神經網路特徵所能看到輸入影像的區域。

2 CSI反饋系統

考慮頻分雙工MIMO下行鏈路，在BS上有$Nt>>1$根天線，在每個UE上有1根天線，在OFDM中有${N}_{\mathrm{c}}$個子載波，第n個子載波的復值接收訊號為：

\[y_n={\mathbf{h}}_n^H \mathbf{b}_n x_n+z_n, \]

${\mathbf{h}}_n \in \mathbb{C}^{N_{\mathrm{t}} \times 1}, (·)^H,\mathbf{b}_n \in \mathbb{C}^{N_{\mathrm{t}} \times 1}, x_n \in \mathbb{C} \text {, 和 } z_n \in \mathbb{C}$分別表示第$n$個子載波上的通道增益向量、共軛轉置、波束成形向量、發射訊號和加性高斯白噪聲(AWGN)。所有子載波的CSI可表示為矩陣${\mathbf{H}}=\left[{\mathbf{h}}_1, {\mathbf{h}}_2, \ldots, {\mathbf{h}}_{{N}_c}\right] \in \mathbb{C}^{N_t \times {N}_c}$，其中共有$2N_cN_t$個元素。

BS的波束形成和預編碼設計需要CSI矩陣H的反饋，但MIMO的天線數量導致巨大的開銷。為了解決這個問題，需要將CSI矩陣H壓縮後再反饋給BS，CSI反饋模型如圖1所示。

圖1 CSI反饋結構

CSI矩陣H首先透過離散傅立葉變換(DFT)從空間域和頻域變換到角域和延遲域，即：

\[\tilde{H}=F_cHF_t^H, \]

其中，$F_c,F_t$分別為$Nc × Nc$和$Nt × Nt $的DFT變換矩陣。由於多徑到達有延遲區間，矩陣$\tilde{H}$在角延遲域中是稀疏的，它可以分為兩部分，一部分是$H_a$，其中有$N_a$行由非零元素組成($N_a < N_c$)，另一部分其餘$N_c−N_a$行由近零元素組成。把通道矩陣$H$壓縮為$H_a$，而且資訊損失可以忽略不計。

為了進一步壓縮CSI矩陣，還要應用基於深度學習的自編碼壓縮和恢復模組，如圖1所示，透過編碼器壓縮CSI矩陣輸出較小的碼字向量：

\[\begin{align*} \boldsymbol{v}=\mathcal {E}(\theta _{1},\boldsymbol{H}_{\boldsymbol{a}}), \tag{3} \end{align*} \]

其中，$\mathcal {E}(·)$代表壓縮操作，$\theta_1$代表編碼器的引數。壓縮後的CSI矩陣透過專用的通道反饋給BS，然後BS透過解碼器恢復CSI矩陣：

\[\begin{align*} \hat{\boldsymbol{H}}_{\boldsymbol{a}}=\mathcal {D}(\theta _{2},\boldsymbol{v}), \tag{4} \end{align*} \]

其中，$\mathcal {D}(·)$代表壓縮操作，$\theta_2$代表解碼器的引數。CSI反饋的目的是為了最小化平均重構誤差：

\[\begin{align*} \min _{(\theta _{1},\theta _{2})} \mathbb {E}||\boldsymbol{H}_{\boldsymbol{a}}-\hat{\boldsymbol{H}}_{\boldsymbol{a}}||_{2}, \tag{5} \end{align*} \]

3 基於空洞卷積的CSI反饋

3.1 DCRNet的結構

基於卷積神經網路的自編碼器可以有效地提取CSI矩陣的空間區域性相關性，基於空洞卷積的DCRNet結構如圖2所示。

圖2 DCRNet的網路結構

在(a)編碼器中，輸入$H_a$的維度為$2×N_a×N_t$，兩個獨立的通道分別代表CSI矩陣的實部和虛部，首先使用5×5的頭卷積來提取和融合CSI矩陣實部和虛部的特徵資訊；然後透過一個編碼塊來提取深度的抽象資訊，與ACRNet不同，為了減少複雜度， DCRNet 中的編碼器只需要一個單元就可以得到17 × 17的 RecF，只比ACRNet中RecF的小一點；隨後利用全連線層來把$2×N_a×N_t$的矩陣壓縮成一維的碼字向量，壓縮比$\mathcal {η}∈(0,1)$；最後碼字透過無線通道傳輸到BS的解碼器。

在(b)解碼器中，輸入碼字經過全連線層進行重塑操作；隨後5×5的頭卷積用來增強通道恢復效能；之後兩個空洞卷積解壓塊來恢復壓縮的資訊。其中批歸一化和引數整流線性單元（parametric rectified linear unit，PReLU）啟用函式應用到每一層卷積之中，帶有可學習引數$α$的PReLU為：

\[\begin{align*} \text{PReLU}(x)=\left\lbrace \begin{array}{ll}x, & x \geq 0 \\ \alpha x, & x< 0. \end{array}\right. \tag{6} \end{align*} \]

3.2 空洞編碼解碼塊的設計

與傳統卷積不同，空洞卷積帶有特定的間隔$d$，也稱作空洞率。二維空洞卷積運算可以寫作：

\[\begin{align*} (\boldsymbol{I}\circledast \boldsymbol{K})[i,j]=\sum _{u}\sum _{v} {\boldsymbol{I}[i+du,j+dv]\cdot \boldsymbol{K}[u,v]}, \tag{7} \end{align*} \]

其中$\circledast,\boldsymbol{I},\boldsymbol{K}$分別表示空洞卷積操作、二維輸入和卷積核，$u,v$為卷積核$\boldsymbol{K}$的指數，空洞率為$d$的空洞卷積有效卷積核大小表示為：

\[\begin{align*} k_{i}^{\prime }=k_{i}+(k_{i}-1)(d-1), \tag{8} \end{align*} \]

其中$k_i,{k^{'}}_i$為當前使用的卷積核大小和有效的卷積核大小。圖3展示了空洞率不同的空洞卷積，在同樣的卷積核大小下，當$d>1$時，空洞卷積比普通卷積能夠提供更大的感受野，可以實現塊稀疏CSI矩陣的稀疏取樣。

圖3 空洞率為1、2、3時的空洞卷積

1）編碼塊設計

雖然隨著空洞率的增加RecF會變大，但連續使用相同空洞率的空洞卷積會造成網格效應和資訊損失。根據混合空洞卷積和非對稱卷積技術，在編碼器塊中採用了d = 1、d = 2和d = 3的非對稱3×3卷積，如圖2所示。可以驗證編碼塊可以獲得大小為13 × 13的RecF，等於CsiNet+的大小。這不僅可以幫助編碼塊提取大規模資訊，關注區域性細節而不產生網格效應，還可以降低計算複雜度。

由於連線不同卷積的特徵可以產生CSI的多解析度以提高系統效能，因此對編碼塊執行連線操作，如圖2（c）所示。採用標準3 × 3濾波器作為空洞卷積的補充，編碼塊的輸入將透過兩個並行分支，一個是空洞卷積，另一個是標準3 × 3卷積。然後將它們的輸出進行連線，透過1 × 1卷積將通道數量減少到2。最後根據殘差學習的思想，使編碼塊的輸入新增到1 × 1卷積的輸出中。

2）解碼塊設計

在圖2（d）中，與編碼塊的設計原則類似，在第一個分支中，使用d = 2的3 × 3空洞卷積將特徵維數增加到$8ρ$，其中$ρ≥1$為網路寬度擴充套件率。透過調整擴充套件率$ρ$，可以使DCRNet-$ρ$ x適用於不同計算能力的模組，然後使用3×1和1×3且d=3的空洞卷積代替標準9×9的卷積，可以有效的減少計算複雜度。隨後使用3×3的卷積來減少特徵通道數到2。

在第二個分支中，不像在編碼塊中只使用一個標準卷積，這裡使用了分組卷積和寬度擴充套件運算，因為BS的計算資源不像UE是有限的，而且寬度擴充套件運算對於CSI反饋同樣重要。其中，1 × 3和3 × 1濾波器分別用於增加和減少特徵維數，5 × 1和1 × 5分組卷積作用與第一個分支中的相似。兩個分支的輸出將被連線在一起，並透過1 × 1的卷積。

由於使用了空洞卷積和多解析度思想，DCRNet比ACRNet的感受野寬得多，而且FLOPs更低，在效能和計算複雜度之間取得了很好的平衡。

4 實驗結果分析

4.1 實驗設定

1）資料

根據COST2100實現室內5.3GHz和室外300MHz的訓練和測試場景，BS處有$N_t=32$個均勻線性天線陣列和$N_c=1024$個子載波，原始大小為$2×32×1024$的CSI矩陣在轉換到角延遲域處理之後，得到$2×32×32$的CSI矩陣，訓練集、驗證集和測試集分別為100000、30000和20000。

2）訓練

使用Kaiming initialization來產生每個卷積層和全連線層的權重，還採用了餘弦退火學習率來增強網路效能，初始學習率的範圍在$\gamma _{min}=5×10^{-5}$到$\gamma _{max}=2×10^{-3}$之間，學習率可以表示為：

\[\begin{align*} \gamma _{t} =\gamma _{min}+\frac{1}{2}(\gamma _{max}-\gamma _{min})\left(1+\cos \left({\frac{t-T_{w}}{T-T_{w}}\pi }\right)\right), \tag{9} \end{align*} \]

其中，$t$是第$t$個訓練時期，$γ_t$是當前的學習率，$T_w$和$T$分別是預熱時期和總時期的數量，分別設定為30和2500。

3）評估標準

使用歸一化均方誤差（NMSE）來評估輸入CSI矩陣${\boldsymbol{H}_{\boldsymbol{a}}}$和輸出CSI矩陣$\hat{\boldsymbol{H}_{\boldsymbol{a}}}$的區別，由下式給出：

\[\text{NMSE}=\mathbb {E}\left\lbrace {\left\Vert \boldsymbol{H}_{\boldsymbol{a}}-\hat{\boldsymbol{H}_{\boldsymbol{a}}}\right\Vert _{2}^{2}}\Big/{\left\Vert \boldsymbol{H}_{\boldsymbol{a}}\right\Vert _{2}^{2}}\right\rbrace, \]

4.2 DCRnet的效能

將DCRNet與基於DL的CSI反饋網路進行比較，分為低複雜度網路組：CsiNet、CRNet、ACRNet和DCRNet，和高複雜度且高效能組：DCRNet10×、DS-NLCsiNet、SOTA CsiNet+和ACRNet10×。

表1列出了上述幾種CSI反饋網路的效能比較，其中壓縮率$η$分別設定為1/4、1/8、1/16和1/32，最佳結果以粗體顯示。從表1中，可以發現DCRNet-1×具有最低的計算複雜度和最少的引數，而且可以在室內場景下實現了不同壓縮率下的SOTA效能，在室外場景下，DCRNet-1×仍然可以以最低的FLOP實現幾乎相同的SOTA效能。

表1 不同網路的NMSE比較

5 結論

文獻提出了DCRNet，網路採用空洞卷積來增加RecF，同時降低計算複雜度。模擬結果表明了DCRNet1×在計算資源有限的情況下優於其它輕量級網路，而且DCRNet-10×以比傳統網路低得多的計算複雜度實現了幾乎相同的重建效能。

閱讀文獻《SCNet：Deep Learning-Based Downlink Channel Prediction for FDD Massive MIMO System》
2023-04-20
Deep Learning for joint channel estimation and feedback in massive MIMO systems(1)
2020-12-17
Spatio-Temporal Representation With Deep Neural Recurrent Network in MIMO CSI Feedback閱讀筆記
2023-03-26
筆記
文獻閱讀——Dynamic Range Compression Preserving Local Image Contrast for Digital Video Camera
2024-08-13
ASTGitIDE
閱讀文獻
2024-05-02
空洞卷積 Dilated Convolution
2024-04-08
卷積
騰訊冷啟動論文閱讀《Enhancing User Interest based on Stream Clustering and Memory Networks in Large-Scale Recommender Systems》
2024-06-09
REST
【文獻閱讀】ES as a Scalable Alternative to RL（OpenAI 17）
2020-09-23
OpenAI
論文閱讀 | An Artificial Neural Network-based Stock Trading System
2019-02-16
[論文閱讀] Temporal Extension Module for Skeleton-Based Action Recognition
2020-12-10
科研基本功——高效文獻檢索與文獻閱讀保姆級教程
2020-04-04
論文翻譯：2021_Towards model compression for deep learning based speech enhancement
2022-04-08
【論文閱讀筆記】Aspect-based sentiment analysis with alternating coattention networks
2020-11-01
筆記
閱讀論文：《MuKEA: Multimodal Knowledge Extraction and Accumulation for Knowledge-based Visual Question Answering》
2022-03-30
論文閱讀：Zeno: Distributed Stochastic Gradient Descent with Suspicion-based Fault-tolerance
2022-12-09
AST
文獻復現——A New Geometric Mean FMEA Method Based on Information Quality
2020-11-06
ORM
一文讀懂容器儲存介面 CSI
2021-04-12
論文解讀（AGC）《Attributed Graph Clustering via Adaptive Graph Convolution》
2022-06-30
GCAPT
論文解讀（GCC）《Efficient Graph Convolution for Joint Node RepresentationLearning and Clustering》
2022-06-28
GC
論文解讀（NGCF）《LightGCN: Simplifying and Powering Graph Convolution Network for Recommendation》
2022-05-14
GC
【資料彙總】GNN從入門到入土+文獻閱讀入門
2020-11-01
GNN
文獻閱讀——Single Clause Assumption without Activation Literals to Speed-up IC3
2024-06-03
2020.11.20 文獻14閱讀《我國水電站地下廠房的發展》
2020-11-20
論文閱讀：SiameseFC
2018-04-09
論文閱讀20241117
2024-11-22
GeoChat論文閱讀
2024-10-29
5G網路能力領先。創新技術方面，廣泛使用Massive MIMO
2022-03-09
為行動通訊爭一先：Massive MIMO的進化三部曲
2021-09-02
《 ZooKeeper : Wait-free coordination for Internet-scale systems 》論文研讀
2020-07-06
AI
阿里DMR論文閱讀
2024-04-29
阿里
[論文閱讀] Hector Mapping
2020-12-16
APP
並行多工學習論文閱讀（五）：論文閱讀總結
2021-11-12
並行
讀論文-序列感知推薦系統(Sequence-Aware Recommender Systems)
2024-04-11
閱文：2020年春節閱讀大資料醫療題材網文閱讀量暴增
2020-02-11
大資料
XGBoost論文閱讀及其原理
2018-05-13
Q-REG論文閱讀
2023-10-04
MapReduce 論文閱讀筆記
2020-06-24
筆記
「DNN for YouTube Recommendations」- 論文閱讀
2020-02-19
DNN