如何用C/C++實現去除字串頭和尾指定的字元

一隻會鏟史的貓 發表於 2022-04-26
C++

程式設計時我們經常需要對字串進行操作,其中有一項操作就是去除字串的頭(尾)指定的字元,比如空格。通常我們會使用封裝好的庫函式或者類函式的Trim方法來實現,如果自己動手寫一個TrimHead和TrimTail函式該如何實現呢?
 
本文針對字串頭(尾)部指定的字元的去除,分別給出兩個實現方法。並分別比較一下改進後的效能如何?

一、從頭部開始去除指定字元

首先從頭遍歷,直到遇見第一個非指定字元,此後將後續字元按順序逐一前移。

// 實現方式一
void TrimHead(char* pszSrc, char chTrim)
{
	if(NULL == pszSrc)
		return;
	
	// 從頭部開始跳過chTrim指定的字元
	char* psz = pszSrc;
	while (*psz && *psz == chTrim) 
		psz++;
	
	// 將後面字元逐一拷貝到前面
	int i = 0;
	while(*psz)
	{
		*(pszSrc+i) = *psz;
		i++;
		psz++;
	}
	*(pszSrc+i) = 0;
}

上述函式中,在找到第一個非指定字元後,通過while函式逐一前移字元,如果後續字串很長的話,效能是不是會比較低?我們改進一下,使用memmove函式替換while操作,下面是實現方法,程式碼更加簡潔易讀。

// 實現方式二
void TrimHeadEx(char* pszSrc, char chTrim)
{
	if(NULL == pszSrc)
		return;

	// 從頭部開始跳過chTrim指定的字元
	int iStrLen = strlen(pszSrc);
	char* psz = pszSrc;
	while (*psz && *psz == chTrim) 
		psz++;

	// psz指向第一個非指定字元的位置
	if(psz != pszSrc)
	{
		// 計算新字串長度
		iStrLen = iStrLen - (psz - pszSrc);
		memmove(pszSrc, psz, (iStrLen+1));	// +1表示將末尾的0也一併拷貝
	}
}

方法二的程式碼要比方法一的簡潔,那麼它的速度會比方法一的快麼?文末會給出答案。

 

二、去除尾部指定的字元

// 實現方式一
void TrimTail(char* pszSrc, char chTrim)
{
	if(NULL == pszSrc)
		return;

	char* psz = pszSrc;
	char* pszLast = NULL;
	
	// 從頭開始遍歷直到整個字串結束
	while(*psz)
	{
		// 遇到指定字元,則用pszLast記住該位置
		if(*psz == chTrim)
		{
			if(NULL == pszLast)
				pszLast = psz;
		}
		else
			pszLast = NULL;
		psz++;
	}
	
	// 如果找到末尾的第一個指定字元,則作為字串的結尾
	if(pszLast != NULL)
		*pszLast = 0;
}

上述方法中,我們需要遍歷完整個字串,如果字串很長的話,或者遇到極端情況,就是結尾沒有指定字元時,也要將整個字串遍歷完畢。顯然這種實現方式的效率並不高。 那麼我們改進一下演算法,從字串的尾部進行遍歷。

// 實現方式二
void TrimTailEx(char* pszSrc, char chTrim)
{
	if(NULL == pszSrc)
		return;

	// 從尾部開始跳過chTrim指定字元
	int iStrLen = strlen(pszSrc);
	char* pszStr = pszSrc;
	int iLastIdx = iStrLen - 1;
	while(iLastIdx >= 0 && *(pszStr+iLastIdx) == chTrim)
		iLastIdx--;
	
	// 計算新字串長度並在結尾賦值為0
	iStrLen = iLastIdx+1;
	*(pszSrc+iStrLen) = 0;
}

上述實現方式是從字串的尾部進行遍歷,實現的方式也更加的簡潔。如果結尾沒有指定字元,該函式會在遍歷第一個字元後就退出,效能顯然要好過方式一。

那麼對於TrimHead和TrimTail的兩種實現,方式二和方式一到底誰快呢?是不是和我們想象的一樣有差距或者差距很大呢?
 

三、測試比較

這裡寫了一個測試函式TestSpeedTrim,為了讓時間更加明顯,在該函式中設定的迴圈次數為10000000。大家可以親自執行測試一下,看看debug和release兩個版本的差異,結果一定會讓你吃驚,可能和你想的並不一樣哦。

#include <time.h>
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
void TestSpeedTrim(bool bTrimHead)
{
	char szTrim1[256] = {0};
	char szTrim2[256] = {0};
	
	char* pszOrigin = "     This is a trim test head/tail    ";
	strcpy(szTrim1, pszOrigin);
	strcpy(szTrim2, pszOrigin);
	
	int i = 0;
	int iCount = 10000000;
	clock_t cStart = 0;
	
	// 第一種Trim方法
	cStart = clock();
	for(i = 0; i < iCount; i++)
	{
		bTrimHead ? TrimHead(szTrim1, ' ') : TrimTail(szTrim1, ' ');
	}
	clock_t cSpan1 = clock() - cStart;
	
	// 第二種Trim方法
	cStart = clock();
	for(i = 0; i < iCount; i++)
	{
		bTrimHead ? TrimHeadEx(szTrim2, ' ') :	TrimTailEx(szTrim2, ' ');
	}
	clock_t cSpan2 = clock() - cStart;
	
	printf("cSpan1 = %d, cSpan2 = %d\r\n", cSpan1, cSpan2);
	printf("szTrim1=[%s]\r\n", szTrim1);
	printf("szTrim2=[%s]\r\n", szTrim2);
}

int main(int argc, char* argv[])
{
	// 測試頭
	printf("刪除頭部的空字元:\r\n");
	TestSpeedTrim(true);

	// 測試尾
	printf("\r\n刪除尾部的空字元:\r\n");
	TestSpeedTrim(false);

	getchar();
	return 0;
}

這裡就不給出比較結果了,因為只有自己親自動手實現並跑一遍後,才會記得更加牢靠。