C++ 將中文轉為UTF8 code(URL碼)

離水的魚兒發表於2018-01-19

最近在做專案的時候這個編碼真是搞的我頭大~~~!資料格式轉來轉去的,其中有一項是做簽名,發現資料部分符號和中文必須轉換成URL碼。下面是中文轉URL碼程式碼!

// URL編碼.cpp : 定義控制檯應用程式的入口點。
//

#include "stdafx.h"
#include<iostream>  
#include<stdio.h>  
#include<windows.h>
using namespace std;  

string  UrlUTF8(char * str);
void GB2312ToUTF_8(string& pOut,char *pText, int pLen);
void Gb2312ToUnicode(WCHAR* pOut,char *gbBuffer);
void  UnicodeToUTF_8(char* pOut,WCHAR* pText);



string  UrlUTF8(char * str)
{
    string tt;
    string dd;
    GB2312ToUTF_8(tt,str,strlen(str));
    int len=tt.length();
    for (int i=0;i<len;i++)
    {
        if(isalnum((BYTE)tt.at(i))) //判斷字元中是否有陣列或者英文
        {
            char tempbuff[2]={0};
            sprintf_s(tempbuff,"%c",(BYTE)tt.at(i));
            dd.append(tempbuff);
        }
        else if (isspace((BYTE)tt.at(i)))
        {
            dd.append("+");
        }
        else
        {
            char tempbuff[4];
            sprintf_s(tempbuff,"%%%X%X",((BYTE)tt.at(i)) >>4,((BYTE)tt.at(i)) %16);
            dd.append(tempbuff);
        }

    }
    return dd;
}
void GB2312ToUTF_8(string& pOut,char *pText, int pLen)
{
    char buf[4];
    memset(buf,0,4);

    pOut.clear();

    int i = 0;
    while(i < pLen)
    {
        //如果是英文直接複製就可以
        if( pText[i] >= 0)
        {
            char asciistr[2]={0};
            asciistr[0] = (pText[i++]);
            pOut.append(asciistr);
        }
        else
        {
            WCHAR pbuffer;
            Gb2312ToUnicode(&pbuffer,pText+i);

            UnicodeToUTF_8(buf,&pbuffer);

            pOut.append(buf);

            i += 2;
        }
    }

    return;
}
void Gb2312ToUnicode(WCHAR* pOut,char *gbBuffer)
{
    ::MultiByteToWideChar(CP_ACP,MB_PRECOMPOSED,gbBuffer,2,pOut,1);
    return;
}
void UTF_8ToUnicode(WCHAR* pOut,char *pText)
{
    char* uchar = (char *)pOut;

    uchar[1] = ((pText[0] & 0x0F) << 4) + ((pText[1] >> 2) & 0x0F);
    uchar[0] = ((pText[1] & 0x03) << 6) + (pText[2] & 0x3F);

    return;
}
void  UnicodeToUTF_8(char* pOut,WCHAR* pText)
{
    // 注意 WCHAR高低字的順序,低位元組在前,高位元組在後
    char* pchar = (char *)pText;

    pOut[0] = (0xE0 | ((pchar[1] & 0xF0) >> 4));
    pOut[1] = (0x80 | ((pchar[1] & 0x0F) << 2)) + ((pchar[0] & 0xC0) >> 6);
    pOut[2] = (0x80 | (pchar[0] & 0x3F));

    return;
}
int _tmain(int argc, _TCHAR* argv[])
{
    char str[]="自助制證";
    string utf8Code="";
    utf8Code=UrlUTF8(str);
    char code[1024];
    strcpy_s(code,utf8Code.c_str());
    for(int i=0;i<utf8Code.length();i++)
    {
        printf("%c",code[i]);
    }
    getchar();
    return 0;
}

這裡寫圖片描述

相關文章