union 概念
union 在中文的叫法中又被稱為共用體,聯合或者聯合體,它定義的方式與 struct 是相同的,但是意義卻與 struct 完全不同,下面是 union 的定義格式:
union 共用體名
{
成員列表
}共用體變數名;
那麼它與結構體的定義方式相同,那麼區別是什麼呢,下面通過一個 struct 與 union 的巢狀來說明兩者的區別所在。
struct my_struct
{
int type;
union my_union
{
char *str;
int number;
}value;
}Elem_t;
訪問方式是同結構體是一樣的,比如我要訪問 number 變數,那麼就可以以如下的方式進行訪問:
Elem_t.value.number = 10;
union 與 struct 的區別是什麼呢?用一句話概括就是共用體中的成員的地址都是一樣的,結構體中的成員都具有各自的地址,下面用一張圖展示 Elem_t 在記憶體中的儲存。
看到變數在記憶體中的儲存位置之後,也就明白 union 的特性了,對於這樣儲存的好處顯而易見,程式中能夠使用不同型別的變數並且只佔用一個變數的儲存空間,能夠節省儲存空間。上述程式中共用體的中兩個成員所佔的儲存空間大小一樣,都是四個位元組,所以最終這個共用體所佔儲存空間的大小就是四個位元組,如果共用體的成員的儲存空間大小不一樣,那麼共用體儲存空間的大小取決於成員中儲存空間最大的一個。
union 的應用
使用 union 來打包資料
在使用聯合在打包資料的時候,必須要清楚當前處理器是大端對齊還是小端對齊。
- 大端對齊:資料的低位儲存在記憶體的高地址中,資料的高位儲存的記憶體的低地址中。
- 小端對齊:資料的低位儲存在記憶體的低地址中,資料的高位儲存在記憶體的高地址中。
下面用圖的形式舉一個例子分別在大端對齊和小端對齊中的儲存形式。
有了大端對齊和小端對齊的認知下,我們來看 union 如何對資料進行打包,下面給出一段程式碼:
#include <stdio.h>
int main(void)
{
union
{
unsigned int word;
struct
{
unsigned char byte1;
unsigned char byte2;
}byte;
}u1;
u1.byte.byte1 = 0x21;
u1.byte.byte2 = 0x43;
printf("The Value of word is:0x%x\n",u1.word);
}
上述的執行結果會根據對齊方式的不一樣而有所差別。
如果是小端模式:
The Value of word is:0x4321
如果是大端模式:
The Value of word is:0x2143
當然對於採用這種方式進行資料的打包來說,弊端也是很明顯的,因為會因為處理器的對齊方式而產生不同的結果,所以,我們往往採用的都是通過資料移位的方式來實現:
uint8_t byte3 = 0x21;
uint8_t byte4 = 0x43;
uint16_t word;
word = (((uint16_t)byte4) << 8)|((uint16_t)byte3);
上述的寫法便不會收到處理器對齊方式的影響,也具有更好地移植性。
union 在資料傳輸中的應用
背景:現在有兩個小車需要進行通訊,分別是小車 A 和小車 B ,有些時候,小車 A 需要向小車 B 傳送它當前的速度,有些時候,小車 A 需要向小車 B 傳送它當前的位置,而有些時候小車 A 需要向小車 B 傳送它當前的狀態。
分析:在上面的背景當中,我們得知傳送的訊息的時候並不是同時要傳送速度,狀態,位置,而是這三個引數分開來的,並不是同時需要,那這個時候,我們就可以採用 union 的特性來構造一個資料結構,這樣做的好處是能夠縮減變數佔用的記憶體,比如說我們不採用 union 來構造的話,通常我們會採用結構體的方式,比如這樣:
struct buffer
{
uint8_t power; /*當前電池容量*/
uint8_t op_mode; /*操作模式*/
uint8_t temp; /*當前的溫度*/
uint16_t x_pos;
uint16_t y_pos;
uint16_t vel; /*小車當前的速度*/
}my_buff;
採用上述的結構的話,我們可以計算一下(不考慮記憶體對齊的情況,記憶體對齊的話要對結構體記憶體進行填充,筆者打算後面單寫一篇文章記錄記憶體對齊的問題),結構體佔用的儲存空間是 9 個位元組,為了優化我們的程式碼,我們可以採用如下的方式來構造我們要傳輸的資料。
union
{
struct
{
uint8_t power;
uint8_t op_mode;
uint8_t temp;
}status;
struct
{
uint16_t x_pos;
uint16_t y_pos;
}position;
uint16_t vel;
}msg_union;
這樣一來,從儲存空間來講,這個 union 所佔的空間只有 4 個位元組。
如果要將傳送的資料封裝成一個資料幀,那上面所定義的 union 就存在問題了,因為接收方就不知道傳送方發過去的是哪個引數,因此,需要在裡面加入引數型別這個變數,於是就有了如下的程式碼:
struct
{
uint8_t msg_type;
union
{
struct
{
uint8_t power;
uint8_t op_mode;
uint8_t temp;
}status;
struct
{
uint16_t x_pos;
uint16_t y_pos;
}position;
uint16_t vel;
}msg_union;
}message;
有了 msg_type 的加入,我們就可以在接收端對資料進行解析了。
小結
通過上述的這個例子,我們現在來回顧一下,如果不使用 union 的話,在進行資料傳輸的時候,直接將由 struct 構造的資料形成資料幀傳送過去,傳送的資料包要比使用 union 構造的資料大不少,使用 union 構造資料,既能夠幫助我們節省了儲存空間,還節省了通訊時的頻寬。
union 在資料解析中的應用
上面一個例子我們使用 union 在資料傳輸中優化了程式碼,那麼 union 在資料解析中又具有什麼作用呢,看下面這樣一段程式碼:
typedef union
{
uint8_t buffer[PACKET_SIZE];
struct
{
uint8_t size;
uint8_t CMD;
uint8_t payload[PAYLOAD_SIZE];
uint8_t crc;
}fields;
}PACKET_t;
// 函式呼叫方法: packet_builder(packet.buffer,new_data)
// 將新資料存到 buffer 的時候,還需要一些額外的操作
// 比如應該將 size 存放 buffer[0]中
// 將 cmd 存放到 buffer[1] 中,依次類推
void packet_builder(uint8_t *buffer,uint8_t data)
{
static uint8_t received_bytes = 0;
buffer[received_bytes++] = data;
}
void packet_handler(PACKET_t *packet)
{
if (packet->fields.size > TOO_BIG)
{
//錯誤
}
if (packet->fields.cmd == CMD)
{
//處理對應的資料
}
}
要理解這個資料解析過程,需要用到 union 中的成員存放在同一個地址這個特性,buffer[PACKET_SIZE]中的元素與 fields 中的元素是一一對應的,用一張圖來表示就很清楚了,如下圖:
看了這張圖,我想就很清楚了,往 buffer 裡寫了資料,直接從 fileds 裡面讀出來就可以了。
總結
運用好 union 不僅僅是能夠節省儲存空間,用好地址共享這個特性也能夠實現很精妙的效果,筆者之前都沒怎麼用過 union,這幾天關於 union 的學習也使筆者意識到路漫漫其修遠兮,但是也引用胡適先生的一句話:怕什麼真理無窮,進一寸有一寸的歡喜。
參考資料:
[1] https://www.allaboutcircuits.com/technical-articles/union-in-c-language-for-packing-and-unpacking-data/
[2] https://www.allaboutcircuits.com/technical-articles/learn-embedded-c-programming-language-understanding-union-data-object/.
[3] https://stackoverflow.com/questions/252552/why-do-we-need-c-unions.
最後,如果您覺得我的文章對您有幫助,歡迎新增我的個人公眾號:wenzi嵌入式軟體,期待與您一同前行~