[C++] 化學方程式的格式化演算法

Exzh_PMGI發表於2018-12-08

網上普遍使用的化學方程式的格式普遍如下

例: KMnO4+FeSO4+H2SO4=Fe2(SO4)3+MnSO4+K2SO4+H2O

要把化學方程式格式化,單單一個正規表示式是非常反人類的,故可選用 C++ 實現化學方程式的格式化。

首先,寫一個 for 迴圈,傳入字元陣列 input[] ,依次地判斷當前字元的位置

然後,宣告一個寬字串: wstring output[]

演算法根據迴圈裡的 if 語句判斷當前字元是否符合條件,然後把這個字元輸出到 output[] 中

for(int i=1;i<strlen(input);++i)
{
// Do something...
};

因為傳入的字元陣列是沒有經過格式化的,所以第一個字元一定不用處理,故迴圈從1開始。

迴圈開始時,先判斷當前的字元是不是空格,如果是空格,就直接無視,跳到下一次的迴圈。

因為直接跳到了下一次的迴圈中,所以 input[i] 的字元沒有加入到 output 中,也就是自動地把空格給除去了。

然後,在判斷當前的字元是否為 +、=、(、) 中的一種,因為這個字元的前後是不可能存在數字下標的,直接加入到輸出的 output[] 陣列中。

同樣的,遇到前一個字元是 +、=、( 也同樣直接加入到輸出陣列中。

實現程式碼:

for (int i = 1;i < strlen(input);++i)
{
    if(input[i] == ` `) continue;
    if (input[i - 1] == `+` || input[i - 1] == `=`
        || input[i - 1] == `(` || input[i] == `+`
        || input[i] == `=` || input[i] == `(`
        || input[i] == `)`) {
        output += input[i];
        continue;
}

繼續我們的判斷,如果當前字元是 A-Z 、 a-z 的,直接加入輸出字元陣列中。

如果當前字元是數字的,直接將它變成下標。

為了防止 C60 這種由超過 9 個原子組成的分子參與化學反應的情況,所以還要加入一句判斷語句來判斷。

實現程式碼:

for (int i = 1;i < strlen(input);++i)
{
    if(input[i] == ` `) continue;
    if (input[i - 1] == `+` || input[i - 1] == `=`
        || input[i - 1] == `(` || input[i] == `+`
        || input[i] == `=` || input[i] == `(`
        || input[i] == `)`) {
        output += input[i];
        continue;
    }

    if (input[i] >= `A` && input[i] <= `Z`) {
            output += input[i];
            continue;
    }

    if (input[i] >= `a` && input[i] <= `z`) {
            output += input[i];
            continue;
    }

    if (input[i - 1] >= `0` && input[i - 1] <= `9`) {
            output += input[i];
            continue;
    }

    if (input[i] >= `0` && input[i] <=`9`)
    {
            outputBigNumToSmall((int)(input[i]-`0`));
    }

}

因為 C++ 標準庫並沒有把數字轉成下標的函式,所以我們要實現一個將數字轉成下標的函式

實現程式碼:

void outputBigNumToSmall(int num)
{
    switch (num)
    {
    case 0:
        output.append(L"");
        break;
    case 1:
        output.append(L"");
        break;
    case 2:
        output.append(L"");
        break;
    case 3:
        output.append(L"");
        break;
    case 4:
        output.append(L"");
        break;
    case 5:
        output.append(L"");
        break;
    case 6:
        output.append(L"");
        break;
    case 7:
        output.append(L"");
        break;
    case 8:
        output.append(L"");
        break;
    case 9:
        output.append(L"");
        break;
    default:
        output.append(L"(unknown)");
        break;
}

至此,只要輸出 output[] 就可以了。

相關文章