C/C++的mem函式和strcopy函式的區別和應用

張程發表於2016-08-20

mem系列函式是面試的時候常考的知識點,我們需要熟練掌握這三個函式的原理和程式碼實現,要能準確無誤的寫出程式碼。

memcpy、memset和memset三個函式在使用過程中,均需包含以下標頭檔案:

//在C中
#include <string.h>
//在C++中
#include <cstring>

memcpy

memcpy函式是C/C++中的記憶體拷貝函式,它的功能是從源src所指的記憶體地址的起始位置開始,拷貝n個位元組到目標dst所指的記憶體地址的起始位置中。

研究函式功能最好的辦法就是研究其原始碼,這裡在網上找了一份,如下:

void * __cdecl memcpy ( void * dst,const void * src,size_t count)
{
    void * ret = dst;
    while (count--)
    { 
        // 注意, memcpy函式沒有處理dst和src區域是否重疊的問題
        *(char *)dst = *(char *)src;
        dst = (char *)dst + 1;
        src = (char *)src + 1;
    }
    return(ret);
}

原始碼比較簡單,定義一個計數,然後從頭到尾一次將src指向的值拷貝給dst,庫函式中的memcpy不能處理dst和src中存在重疊部分這種情況。

那麼處理重疊部分的話,我們可以採用從後往前依次拷貝的方法,下面給出我修改過的函式程式碼:

void * __cdecl memcpy ( void * dst,const void * src,size_t count)
{
	char *pDst = static_cast<char *> dst;
	const char *pSrc = static_cast<const char *> src;
   	//檢查引數
   	if(pDst==NULL || pSrc== NULL || count <=0){
   		return NULL;
  	}
   	//判斷有是否存在重疊部分
   	if(pDst > pSrc && pDst < pSrc + count){
   		for(size_t i=count-1; i>=0; i--)
        {
            pDest[i] = pSrc[i];
        }
   	}
   	else {
   		for(size_t i=0; i<count; i++)
        {
            pDest[i] = pSrc[i];
        }
   	}
   	return pDst;
}

memset

memset一般用於對記憶體初始化,在這裡需要注意的是,memset函式是對記憶體的每個位元組(按位元組)設定成c的值。其函式原型如下:

void memset(void *s, int c, size_t n)
{
	const unsigned char uc = c;//將int轉換成char,截去c的高24位,留下低8位
	unsigned char *su;
	for (su = s; 0 < n; ++su, --n)
		*su = uc;
	return s;
}

注意,這裡有一個坑,memset一般用於將記憶體清零,你要是想將這段記憶體初始化為1而寫下下面的程式碼:

int num[10];
memset(num,1,sizeof(int)*10);

這裡並不會如你所願,num的每一個數都被初始化為16843009,原因就是上述提到的會截去c的高24位。

使用memset初始化比用for迴圈初始化要快很多,所以在初始化基本型別資料,結構體等的時候儘量選擇memset,memset可以方便的清空一個結構型別的變數或陣列。

memmove

它與memcpy的功能相似,都是將src所指的n個位元組複製到dst所指的記憶體地址的起始位置,不同的是它處理了src和dst有重疊的情況。但是當目標區域與源區域沒有重疊則和memcpy函式功能相同。(與上述修改過得memcpy基本一致)

所以基本原則就是,如果你能確保兩段記憶體沒有重疊的部分,就使用memcpy來進行拷貝;如果你不能確定,為了保證複製的正確性,必須用memmove。
其實現程式碼如下:

void* memmove(void* dest, void* src, size_t count)
{
	void* ret = dest;
	if (dest <= src || dest >= (src + count))
	{
		//Non-Overlapping Buffers
		//copy from lower addresses to higher addresses
		while (count --)
			*dest++ = *src++;
	}
	else
	{
		//Overlapping Buffers
		//copy from higher addresses to lower addresses
		dest += count - 1;
		src += count - 1;
		while (count--)
			*dest-- = *src--;
	}
	return ret;
}

strcpy

strcpy是C語言的標準庫函式,使用strcpy需要包含以下標頭檔案:

#include <string.h>
#include <stdio.h>

其函式功能是把從src地址開始且含有NULL結束符的字串複製到dst開始的地址空間,返回指向dst的指標。其函式程式碼如下:

char* strcpy(char* dst , char* src){
	if(dst==NULL||src==NULL) return NULL;// --1
	if(dst==src) return dst;	//--2
	char* address = dst;	//--3
	while((*dst++ = *src++)!='\0') //--4
	return address;		//--5
}

圖中標出來的都是考點,下面一一說明:

  • 1、需要判斷引數的正確性,這裡也可以丟擲一個異常
  • 2、如果指向了同一塊記憶體,不用複製直接返回即可
  • 3、這裡需要儲存原始的dst指標,用作返回值
  • 4、這裡有一個技巧,如果寫成以下兩種,面試的時候會大大扣分!
//第一種
while(*dst++ = *src++)  //直接越界訪問,沒有檢查指標的有效性
//第二種
while(*src!='\0'){*dst++ = *src++;}//考慮了src的邊界問題,沒有在dst的後面加'\0',會導致dst的長度未知引起錯誤
  • 5、函式返回dst的原始值是為了能夠支援鏈式表示式,增加了函式的附加性。

上述第5點可以用如下測試程式碼來說明:

int length = strlen(strcpy(strA,strB));//如果不支援鏈式表示式,這裡會報錯。

那麼有時候也會問為什麼不返回src的原始值,錯誤原因有以下三點:

  • 源字串本來就已知,返回沒有什麼意義
  • 不能支援形如char * strA = strcpy(new char[10],strB) 這樣的表示式
  • 為了保護源字串,使用const限定了src所指的內容,把const char作為char的返回值,型別不符,編譯器會報錯。

strcpy和memcpy的不同點

這個也是常見的考點,主要分為以下三點不同:

  • 複製內容不同:strcpy只能複製字串,而memcpy可以複製任何內容,例如字元陣列,整型,結構體等
  • 複製的方法不同:strcpy不需要指定長度,它遇到字串結束符’\0’才結束,所以容易溢位。memcpy則需要傳入第三個引數來指定長度
  • 用途不同:通常在複製字串的時候用strcpy,而需要複製其他資料型別的時候則一般用memcpy。

相關文章