java獲取漢字的首字母

livedba發表於2012-04-09
java獲取漢字的首字母工具類[@more@]

package net.uni.util;

/**
* 處理內容:獲得輸入漢字的首字母
* @version: 1.0
* @see:net.uni.util.CnToSpell.java
* @date:2012-4-9
* @author:孫偉
*/
public class CnToSpell {

//字母Z使用了兩個標籤,這裡有27個值
//i, u, v都不做聲母, 跟隨前面的字母
private char[] chartable =
{
'啊', '芭', '擦', '搭', '蛾', '發', '噶', '哈', '哈',
'擊', '喀', '垃', '媽', '拿', '哦', '啪', '期', '然',
'撒', '塌', '塌', '塌', '挖', '昔', '壓', '匝', '座'
};

private char[] alphatable =
{
'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i',
'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r',
's', 't', 'u', 'v', 'w', 'x', 'y', 'z'
};

private int[] table = new int[27];
//初始化
{
for (int i = 0; i < 27; ++i) {
table[i] = gbValue(chartable[i]);
}
}


//主函式,輸入字元,得到他的聲母,
//英文字母返回對應的小寫字母
//其他非簡體漢字返回 '0'
public char charAlpha(char ch){
if (ch >= 'a' && ch <= 'z')
//return (char) (ch - 'a' + 'A');
return ch;
if (ch >= 'A' && ch <= 'Z')
return (char) (ch - 'A' + 'a');
if (ch >= '0' && ch <= '9')
return ch;
int gb = gbValue(ch);
if (gb < table[0])
return '0';
int i;
for (i = 0; i < 26; ++i){
if (match(i, gb)) break;
}
if (i >= 26)
return '0';
else
return alphatable[i];
}

//根據一個包含漢字的字串返回一個漢字拼音首字母的字串
public String getBeginCharacter(String SourceStr){

String Result = "";
int StrLength = SourceStr.length();
int i;
try {
for (i = 0; i < StrLength; i++) {
Result += charAlpha(SourceStr.charAt(i));
}
} catch (Exception e){
Result = "";
}
return Result;
}

private boolean match(int i, int gb){

if (gb < table[i])
return false;
int j = i + 1;

//字母Z使用了兩個標籤
while (j < 26 && (table[j] == table[i])) ++j;
if (j == 26)
return gb <= table[j];
else
return gb < table[j];
}

//取出漢字的編碼
private int gbValue(char ch){

String str = new String();
str += ch;
try{
byte[] bytes = str.getBytes("GB2312");
if (bytes.length < 2)
return 0;
return (bytes[0] << 8 & 0xff00) + (bytes[1] &
0xff);
} catch (Exception e){
return 0;
}
}

public static void main(String[] args){
CnToSpell obj1 = new CnToSpell();
System.out.println(obj1.getBeginCharacter("測試資料8ADGaadf"));
return;
}
}

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/25261409/viewspace-1057862/,如需轉載,請註明出處,否則將追究法律責任。

相關文章