工作中碰到的Java問題整理及解決方案

csdnmrliu發表於2018-09-28

1.SOH分隔符(Notepad++)

SOH是ASCII碼錶為ASCII值==1的控制字元(不可見)char字元:0x01

完整ASCII碼錶見:https://www.cnblogs.com/myblesh/articles/2495378.html

Java String.split() 以SOH為分隔符的字串

//第一種方案(最優解決方案)
lineTxt.split("\001", -1);
str.split("\u0001", -1);

//第二種方案和第一種類似
private static final byte[] SOH = { 0x01 };
private static final String SPLIT = new String(SOH);
lineTxt.split(SPLIT, -1);

//第三種解決方案比較麻煩(之前不知道第一種解決方案)
//先把SOH字元替換為‘|’,再使用split("\\|", -1);
public static String conver(String lineTxt){
	char[] cs = lineTxt.toCharArray();
	StringBuilder builder = new StringBuilder();
	for (char c : cs) {
		if(c == 0x01){
			builder.append("|");
		}else{
			builder.append(c);
		}
	}
	return builder.toString();
}

測試第一種方案

/**
 * 測試SOH控制字元為分隔符
 */
@Test
public void test(){
	char c = 0x01;
	String xdrstr = "2018072607182018-07-26 07:18:34.3422018-07-26 07:18:34.3744600773516111053532680788981525353268076\\N25525525525565535\\N65535241763786765535255429496729532416838592749884294967295255.255.255.255255.255.255.255\\N100.84.4.1\\N100.84.88.249364123641265535429496729513648107873458IMS.mnc000.mcc460.gprs1861573551700318051912552557098226391199377408\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N\\N03555\\N5b59054a0000bd7600bd7601b249388c";
	System.out.println(xdrstr.split("\001")[1]);
}

@Test
public void test09(){
	String str = "428\u00011\u000152358\u00010\u00010\u00010\u0001416\u00013102\u000128985\u00010\u00012018-11-19 16:48:33.578653440\u00012818689326047227317\u0001255\u00010\u00010\u000112\u00010\u000112\u0001255\u0001255\u0001255\u00013322070061\u000136097\u000164\u00010\u00010.0.0.0\u00010.0.0.0\u000133628723\u0001297304\u000110.100.0.3\u000110.107.105.46\u000136412\u00012901\u0001146929409\u000131136\u0001460\u00011\u00011\u00010\u00013200465\u00013200465\u0001\u0001\u0001\u0001\u0001255\u0001255\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010\u00010\u00010\u00010\u00010\u000165535\u000165535\u00010\u00010";
	System.out.println(str.split("\u0001", -1)[40]);
}

Linux下awk分析結構化檔案(以SOH為分隔符)

分隔符轉義,單雙引號是有區別的

 

 

相關文章