自己用MFC写了一个浏览器,实现了页面的显示和代码的显示,但是现在出现问题了,就是编码的问题。我在MFC下用的UNICODE的字符,当遇到网页的编码是utf-8的时候汉字会显示乱码,所以想请教大家这种情况该怎么办??

解决方案 »

  1.   

    转换编码,用MultiByteToWideChar

    WideCharToMultiByte
      

  2.   

    void UTF8ToGBK( char *&szOut )
    {
    unsigned short *wszGBK;
    char *szGBK;
    //长度
    int len = MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, NULL, 0);
    wszGBK = new unsigned short[len+1];
    memset(wszGBK, 0, len * 2 + 2);
    MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, (LPWSTR)wszGBK, len); //长度
    len = WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, NULL, 0, NULL, NULL);
    szGBK = new char[len+1];
    memset(szGBK, 0, len + 1);
    WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, szGBK, len, NULL, NULL); //szOut = szGBK; //这样得到的szOut不正确,因为此句意义是将szGBK的首地址赋给szOut,当delete []szGBK执行后szGBK的内 //存空间将被释放,此时将得不到szOut的内容 memset(szOut,'\0',strlen(szGBK)+1); //改将szGBK的内容赋给szOut ,这样即使szGBK被释放也能得到正确的值
    memcpy(szOut,szGBK,strlen(szGBK));
    delete []szGBK;
    delete []wszGBK;
    }void GBKToUTF8(char* &szOut)
    {
    char* strGBK = szOut; int len=MultiByteToWideChar(CP_ACP, 0, (LPCSTR)strGBK, -1, NULL,0);
    unsigned short * wszUtf8 = new unsigned short[len+1];
    memset(wszUtf8, 0, len * 2 + 2);
    MultiByteToWideChar(CP_ACP, 0, (LPCSTR)strGBK, -1, (LPWSTR)wszUtf8, len); len = WideCharToMultiByte(CP_UTF8, 0, (LPWSTR)wszUtf8, -1, NULL, 0, NULL, NULL);
    char *szUtf8=new char[len + 1];
    memset(szUtf8, 0, len + 1);
    WideCharToMultiByte (CP_UTF8, 0, (LPWSTR)wszUtf8, -1, szUtf8, len, NULL,NULL); //szOut = szUtf8;
    memset(szOut,'\0',strlen(szUtf8)+1);
    memcpy(szOut,szUtf8,strlen(szUtf8)); delete[] szUtf8;
    delete[] wszUtf8;
    }