網上普遍使用的化學方程式的格式普遍如下
例: KMnO4+FeSO4+H2SO4=Fe2(SO4)3+MnSO4+K2SO4+H2O
要把化學方程式格式化,單單一個正規表示式是非常反人類的,故可選用 C++ 實現化學方程式的格式化。
首先,寫一個 for 迴圈,傳入字元陣列 input[] ,依次地判斷當前字元的位置
然後,宣告一個寬字串: wstring output[]
演算法根據迴圈裡的 if 語句判斷當前字元是否符合條件,然後把這個字元輸出到 output[] 中
for(int i=1;i<strlen(input);++i) { // Do something... };
因為傳入的字元陣列是沒有經過格式化的,所以第一個字元一定不用處理,故迴圈從1開始。
迴圈開始時,先判斷當前的字元是不是空格,如果是空格,就直接無視,跳到下一次的迴圈。
因為直接跳到了下一次的迴圈中,所以 input[i] 的字元沒有加入到 output 中,也就是自動地把空格給除去了。
然後,在判斷當前的字元是否為 +、=、(、) 中的一種,因為這個字元的前後是不可能存在數字下標的,直接加入到輸出的 output[] 陣列中。
同樣的,遇到前一個字元是 +、=、( 也同樣直接加入到輸出陣列中。
實現程式碼:
for (int i = 1;i < strlen(input);++i) { if(input[i] == ` `) continue; if (input[i - 1] == `+` || input[i - 1] == `=` || input[i - 1] == `(` || input[i] == `+` || input[i] == `=` || input[i] == `(` || input[i] == `)`) { output += input[i]; continue; }
繼續我們的判斷,如果當前字元是 A-Z 、 a-z 的,直接加入輸出字元陣列中。
如果當前字元是數字的,直接將它變成下標。
為了防止 C60 這種由超過 9 個原子組成的分子參與化學反應的情況,所以還要加入一句判斷語句來判斷。
實現程式碼:
for (int i = 1;i < strlen(input);++i) { if(input[i] == ` `) continue; if (input[i - 1] == `+` || input[i - 1] == `=` || input[i - 1] == `(` || input[i] == `+` || input[i] == `=` || input[i] == `(` || input[i] == `)`) { output += input[i]; continue; } if (input[i] >= `A` && input[i] <= `Z`) { output += input[i]; continue; } if (input[i] >= `a` && input[i] <= `z`) { output += input[i]; continue; } if (input[i - 1] >= `0` && input[i - 1] <= `9`) { output += input[i]; continue; } if (input[i] >= `0` && input[i] <=`9`) { outputBigNumToSmall((int)(input[i]-`0`)); } }
因為 C++ 標準庫並沒有把數字轉成下標的函式,所以我們要實現一個將數字轉成下標的函式
實現程式碼:
void outputBigNumToSmall(int num) { switch (num) { case 0: output.append(L"₀"); break; case 1: output.append(L"₁"); break; case 2: output.append(L"₂"); break; case 3: output.append(L"₃"); break; case 4: output.append(L"₄"); break; case 5: output.append(L"₅"); break; case 6: output.append(L"₆"); break; case 7: output.append(L"₇"); break; case 8: output.append(L"₈"); break; case 9: output.append(L"₉"); break; default: output.append(L"(unknown)"); break; }
至此,只要輸出 output[] 就可以了。