PHP如何替換多個字串不同位置不同長度的子串

寫php的老王發表於2019-01-23

都知道substr_replace可以替換指定位置的子串。比如substr_repace("Hello Test",'xxxx',1,4)替換成Hxxxx Test

那麼如何實現替換多個字串不同位置不同長度的子串。

$data = [
'Hello Test',
'QQ mytest',
'Sina email'
]
複製程式碼

比如上面一個陣列,現在需要把陣列第i個元素的第i個字串後面的4個字串替換陳xxxx

$data = [
	'Hxxxx Test',
	'QQxxxxest',
	'Sinxxxxail'
]
複製程式碼

其實,substr_replace也可以實現多個字串子串的替換。

substr_replace函式定義

substr_replace ( mixed $string , mixed $replacement , mixed $start [, mixed $length ] ) : mixed

複製程式碼

substr_replace原始碼在ext/standard/string.c中。先看一下整體的結構

...
if (zend_parse_parameters(ZEND_NUM_ARGS(), "zzz|z/", &str, &repl, &from, &len) == FAILURE) {
	return;
}
...
if (Z_TYPE_P(str) != IS_ARRAY) {
	if (Z_TYPE_P(from) != IS_ARRAY) {
		if (Z_TYPE_P(repl) == IS_ARRAY) {
			...
		} else {
			repl_str = Z_STR_P(repl);
		}
	} else {
		php_error_docref(NULL, E_WARNING, "Functionality of 'start' and 'length' as arrays is not implemented");
		RETURN_STR_COPY(Z_STR_P(str));
	}
} else { 
...
}
複製程式碼

substr_repace首先根據替換需要替換的內容的型別區分。字元型別和陣列型別的替換採用不同的處理方式。同時字元型別也對起始位置引數from做了限制,這中情況下,不接受陣列型別作為起始位置。

對於字元資料的替換

if (Z_TYPE_P(repl) == IS_ARRAY) {
	repl_idx = 0;
	while (repl_idx < Z_ARRVAL_P(repl)->nNumUsed) {
		tmp_repl = &Z_ARRVAL_P(repl)->arData[repl_idx].val;
		if (Z_TYPE_P(tmp_repl) != IS_UNDEF) {
			break;
		}
		repl_idx++;
	}
	if (repl_idx < Z_ARRVAL_P(repl)->nNumUsed) {
		repl_str = zval_get_string(tmp_repl);
		repl_release = 1;
	} else {
		repl_str = STR_EMPTY_ALLOC();
	}
} else {
	repl_str = Z_STR_P(repl);
}

result = zend_string_safe_alloc(1, Z_STRLEN_P(str) - l + ZSTR_LEN(repl_str), 0, 0);

memcpy(ZSTR_VAL(result), Z_STRVAL_P(str), f);
if (ZSTR_LEN(repl_str)) {
	memcpy((ZSTR_VAL(result) + f), ZSTR_VAL(repl_str), ZSTR_LEN(repl_str));
}
memcpy((ZSTR_VAL(result) + f + ZSTR_LEN(repl_str)), Z_STRVAL_P(str) + f + l, Z_STRLEN_P(str) - f - l);
ZSTR_VAL(result)[ZSTR_LEN(result)] = '\0';
if (repl_release) {
	zend_string_release(repl_str);
}
RETURN_NEW_STR(result);

複製程式碼

如果替換的目標是一個陣列,則取陣列第一個元素作為實際替換的內容。

l是傳入的第四個引數處理之後的長度值(l取值0-原字串長度)。然後執行三個copy操作,分別把from之前的原始字串,替換後的字串,from+l之後的字串拷貝到結果字串中取。所以說,這裡的l指定的是原字串有多少個字元被替換。

如果要替換的內容是一個字串陣列的話,內部處理結構如下:


ZEND_HASH_FOREACH_KEY_VAL(Z_ARRVAL_P(str), num_index, str_index, tmp_str) {
	zend_string *orig_str = zval_get_string(tmp_str);
	if (Z_TYPE_P(from) == IS_ARRAY) {
		...
		if (from_idx < Z_ARRVAL_P(from)->nNumUsed) {
			...
			from_idx++;
			...
		}
		...
	} else {
		...
	}
	if (argc > 3 && Z_TYPE_P(len) == IS_ARRAY) {
		...
		if (len_idx < Z_ARRVAL_P(len)->nNumUsed) {
			...
			len_idx++;
			...
		}
		...
	} else if (argc > 3) {
		l = Z_LVAL_P(len);
	} else {
		l = ZSTR_LEN(orig_str);
	}
	...
	if (Z_TYPE_P(repl) == IS_ARRAY) {
		...
		if (repl_idx < Z_ARRVAL_P(repl)->nNumUsed) {
			zend_string *repl_str = zval_get_string(tmp_repl);
			result_len += ZSTR_LEN(repl_str);
			repl_idx++;
			...
		}
	} else {
		...
	}
	zend_string_release(orig_str);
} ZEND_HASH_FOREACH_END();

複製程式碼

執行一個for迴圈,拆分成對每個陣列元素的處理。在陣列處理中,需要處理起始位置引數,長度引數是陣列的情況。所以迴圈中對form,len,repl引數型別進行檢查。如果是陣列型別,則在每次替換之後下標進行加一操作。保證每次迴圈,獲取到的是對應於該陣列元素需要替換的內容,起始位置,和替換長度。

有以下幾點需要了解:

  1. length長度是指替換長度,用repacement替換 string[start]...string[start+length],下面幾個例項能夠很好的說明其中的含義。

length長度小於替換字串長度的時候,比如substr_replace('Hello Test','xxxx',2) 輸出內容Hxxxxlo Test。length長度大於替換字串長度,比如substr_replace('Hello Test','xxxx',6) 輸出內容Hxxxxest,length大於原字串長度的時候,比如substr_replace('Hello Test','xxxx',12) 輸出內容Hxxxx

  • string為字串的時候,replacement可以是陣列,實際替換是去陣列第一個元素

substr_replace('Hello Test',['xxxx'],4)實際上和substr_replace('Hello Test','xxxx',4)效果一樣

  • 當需要替換的內容是陣列的時候,replacement,from,length可以是陣列,也可以部分是陣列。php對於幾個陣列引數,如果不對應會進行相應的處理
$s1 = substr_replace(["Hello Test"], ["xxxx"],[1,2],[3,4]);
$s1=>[
	[0]=>'Hxxxxo Test'
]
複製程式碼

起始位置和長度比要替換的內容多,自動忽略。

$s2 = substr_replace(["Hello Test","qqqq"], ["xxxx"],[1],[3]);
$s1=>[
	[0]=>'Hxxxxo Test',
	[1]=>''
]
複製程式碼

原陣列多,替換後陣列少,則相當於替換成空字串,即等價於一下內容:

$s2 = substr_replace(["Hello Test","qqqq"], ["xxxx",""],[1],[3]);
$s1=>[
	[0]=>'Hxxxxo Test',
	[1]=>''
]
複製程式碼
$s2 = substr_replace(["Hello Test","qqqq"], ["xxxx","ff"],[1],[3]);
$s1=>[
	[0]=>'Hxxxxo Test',
	[1]=>'ff'
]
複製程式碼

替換起始位置,長度陣列不夠,則認為起始位置是0,長度是整個字串。即等價於:

$s2 = substr_replace(["Hello Test","qqqq"], ["xxxx","ff"],[1,0],[3,strlen("qqqq")]);
$s1=>[
	[0]=>'Hxxxxo Test',
	[1]=>'ff'
]
複製程式碼

如果部分引數不是陣列,則對需要替換的陣列都是有效的。

$s2 = substr_replace(["Hello Test","qqqqq"], "xx",[1,0],3);
$s1=>[
	[0]=>'Hxxo Test',
	[1]=>'xxqq'
]
複製程式碼

等價於

$s2 = substr_replace(["Hello Test","qqqqq"], ["xx","xx"],[1,0],[3,3]);
$s1=>[
	[0]=>'Hxxo Test',
	[1]=>'xxqq'
]
複製程式碼

相關文章