程式設計時我們經常需要對字串進行操作,其中有一項操作就是去除字串的頭(尾)指定的字元,比如空格。通常我們會使用封裝好的庫函式或者類函式的Trim方法來實現,如果自己動手寫一個TrimHead和TrimTail函式該如何實現呢?
本文針對字串頭(尾)部指定的字元的去除,分別給出兩個實現方法。並分別比較一下改進後的效能如何?
一、從頭部開始去除指定字元
首先從頭遍歷,直到遇見第一個非指定字元,此後將後續字元按順序逐一前移。
// 實現方式一
void TrimHead(char* pszSrc, char chTrim)
{
if(NULL == pszSrc)
return;
// 從頭部開始跳過chTrim指定的字元
char* psz = pszSrc;
while (*psz && *psz == chTrim)
psz++;
// 將後面字元逐一拷貝到前面
int i = 0;
while(*psz)
{
*(pszSrc+i) = *psz;
i++;
psz++;
}
*(pszSrc+i) = 0;
}
上述函式中,在找到第一個非指定字元後,通過while函式逐一前移字元,如果後續字串很長的話,效能是不是會比較低?我們改進一下,使用memmove函式替換while操作,下面是實現方法,程式碼更加簡潔易讀。
// 實現方式二
void TrimHeadEx(char* pszSrc, char chTrim)
{
if(NULL == pszSrc)
return;
// 從頭部開始跳過chTrim指定的字元
int iStrLen = strlen(pszSrc);
char* psz = pszSrc;
while (*psz && *psz == chTrim)
psz++;
// psz指向第一個非指定字元的位置
if(psz != pszSrc)
{
// 計算新字串長度
iStrLen = iStrLen - (psz - pszSrc);
memmove(pszSrc, psz, (iStrLen+1)); // +1表示將末尾的0也一併拷貝
}
}
方法二的程式碼要比方法一的簡潔,那麼它的速度會比方法一的快麼?文末會給出答案。
二、去除尾部指定的字元
// 實現方式一
void TrimTail(char* pszSrc, char chTrim)
{
if(NULL == pszSrc)
return;
char* psz = pszSrc;
char* pszLast = NULL;
// 從頭開始遍歷直到整個字串結束
while(*psz)
{
// 遇到指定字元,則用pszLast記住該位置
if(*psz == chTrim)
{
if(NULL == pszLast)
pszLast = psz;
}
else
pszLast = NULL;
psz++;
}
// 如果找到末尾的第一個指定字元,則作為字串的結尾
if(pszLast != NULL)
*pszLast = 0;
}
上述方法中,我們需要遍歷完整個字串,如果字串很長的話,或者遇到極端情況,就是結尾沒有指定字元時,也要將整個字串遍歷完畢。顯然這種實現方式的效率並不高。 那麼我們改進一下演算法,從字串的尾部進行遍歷。
// 實現方式二
void TrimTailEx(char* pszSrc, char chTrim)
{
if(NULL == pszSrc)
return;
// 從尾部開始跳過chTrim指定字元
int iStrLen = strlen(pszSrc);
char* pszStr = pszSrc;
int iLastIdx = iStrLen - 1;
while(iLastIdx >= 0 && *(pszStr+iLastIdx) == chTrim)
iLastIdx--;
// 計算新字串長度並在結尾賦值為0
iStrLen = iLastIdx+1;
*(pszSrc+iStrLen) = 0;
}
上述實現方式是從字串的尾部進行遍歷,實現的方式也更加的簡潔。如果結尾沒有指定字元,該函式會在遍歷第一個字元後就退出,效能顯然要好過方式一。
那麼對於TrimHead和TrimTail的兩種實現,方式二和方式一到底誰快呢?是不是和我們想象的一樣有差距或者差距很大呢?
三、測試比較
這裡寫了一個測試函式TestSpeedTrim,為了讓時間更加明顯,在該函式中設定的迴圈次數為10000000。大家可以親自執行測試一下,看看debug和release兩個版本的差異,結果一定會讓你吃驚,可能和你想的並不一樣哦。
#include <time.h>
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
void TestSpeedTrim(bool bTrimHead)
{
char szTrim1[256] = {0};
char szTrim2[256] = {0};
char* pszOrigin = " This is a trim test head/tail ";
strcpy(szTrim1, pszOrigin);
strcpy(szTrim2, pszOrigin);
int i = 0;
int iCount = 10000000;
clock_t cStart = 0;
// 第一種Trim方法
cStart = clock();
for(i = 0; i < iCount; i++)
{
bTrimHead ? TrimHead(szTrim1, ' ') : TrimTail(szTrim1, ' ');
}
clock_t cSpan1 = clock() - cStart;
// 第二種Trim方法
cStart = clock();
for(i = 0; i < iCount; i++)
{
bTrimHead ? TrimHeadEx(szTrim2, ' ') : TrimTailEx(szTrim2, ' ');
}
clock_t cSpan2 = clock() - cStart;
printf("cSpan1 = %d, cSpan2 = %d\r\n", cSpan1, cSpan2);
printf("szTrim1=[%s]\r\n", szTrim1);
printf("szTrim2=[%s]\r\n", szTrim2);
}
int main(int argc, char* argv[])
{
// 測試頭
printf("刪除頭部的空字元:\r\n");
TestSpeedTrim(true);
// 測試尾
printf("\r\n刪除尾部的空字元:\r\n");
TestSpeedTrim(false);
getchar();
return 0;
}
這裡就不給出比較結果了,因為只有自己親自動手實現並跑一遍後,才會記得更加牢靠。