我的转换函数为:
void ConvertUtf8ToGBK(char* strUtf8) 
{
int len=MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)strUtf8, -1, NULL,0);
unsigned short * wszGBK = new unsigned short[len+1];
memset(wszGBK, 0, len * 2 + 2);
MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)strUtf8, -1, wszGBK, len); len = WideCharToMultiByte(CP_ACP, 0, wszGBK, -1, NULL, 0, NULL, NULL);
char *szGBK=new char[len + 1];
memset(szGBK, 0, len + 1);
WideCharToMultiByte (CP_ACP, 0, wszGBK, -1, szGBK, len, NULL,NULL); memcpy(strUtf8,szGBK,len+1);
delete[] szGBK;
delete[] wszGBK;
}
但是接收到网站的信息为乱码,转换后依然是乱码。
下面是未经转换的内容。【【【【有没有可能不是文本内容??????但是确实是打开了一个网页。-----------------------------------------------------------------------------
192.168.1.106->XX.XX.XXX.X
Port:1634->80
32位序列号:3802156985
32位确认号:3920084460
urgentPointer:0
4位首部长度:1
6位标志位:18POST /djob.do HTTP/1.1Accept: application/x-shockwave-flash, image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, application/x-silverlight, */*Referer: http://mob.xxxxxxx.com/job.doAccept-Language: zh-cnContent-Type: application/x-www-form-urlencodedAccept-Encoding: gzip, deflateUser-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1;  Embedded Web Browser from: http://bsalsa.com/; .NET CLR 2.0.50727; CIBA)Host: mob.xxxxxxx.comContent-Length: 4Connection: Keep-AliveCache-Control: no-cacheCookie: syshomeforreg=1; __utma=204579609.708102741.1224668536.1224757355.1224758158.12; __utmz=204579609.1224745540.9.6.utmccn=(referral)|utmcsr=hao123.com|utmcct=/|utmcmd=referral; _de=darksage; mop_uniq_ckid=58.213.198.81_1224668531_1127186921; xnusername=%E9%BB%8E%E4%B8%AD%E6%B5%A9; homeinfo8134798120080828=0; __utmb=204579609; WebOnLineNotice_201264257=1; XNESSESSIONID=abcSB4j_2CdsAgUbKrP0r; __utmc=204579609; userid=201264257; univid=8006; gender=1; univyear=2006; societyguester=09ec732f71717dcb3c4dd7a09c1da0a47; kl=66f1823edd0d9d32d99a5173cc8e59bc_201264257; hostid=201264257; xn_app_histo_201264257=6-8-19-4-2-16555-3-12012-13462-25-17-20805-----------------------------------------------------------------------------
192.168.1.106->XX.XX.XXX.X
Port:1634->80
32位序列号:3802158247
32位确认号:3920084460
urgentPointer:0
4位首部长度:1
6位标志位:18id=7-----------------------------------------------------------------------------
XX.XX.XXX.X->192.168.1.106
Port:80->1634
32位序列号:3920084460
32位确认号:3802158247
urgentPointer:0
4位首部长度:1
6位标志位:ACK      -----------------------------------------------------------------------------
XX.XX.XXX.X->192.168.1.106
Port:80->1634
32位序列号:3920084460
32位确认号:3802158251
urgentPointer:0
4位首部长度:1
6位标志位:ACK      -----------------------------------------------------------------------------
XX.XX.XXX.X->192.168.1.106
Port:80->1634
32位序列号:3920084460
32位确认号:3802158251
urgentPointer:0
4位首部长度:1
6位标志位:ACKHTTP/1.1 200 OKServer: Resin/3.0.21Vary: Accept-EncodingCache-Control: no-cachePragma: no-cacheExpires: Thu, 01 Jan 1970 00:00:00 GMTContent-Encoding: gzipContent-Type: text/html;charset=UTF-8Content-Length: 5469Connection: closeDate: Thu, 23 Oct 2008 10:36:15 GMT?       韂{sG?W?Lt?賙yF#蓲@V?l 乴j!w鱒*?Ici@歈fF~苴?0?儞€韯G ??岦?谚?_釣顬???PQe蚅O鏖_?瘇nW鶇?'矯TRMЖ?痂?斔M??犻?R:|庳Q视肞'dNTU怐.E訃>uQ猣鲅麴餻习稧?魤?垨?莳璬O\嵒"]a\酘:%*}u葂B?)嶓騖<褽翉斲嚳袘??痳*镦渴
C}?挩颌?1氠]T尲豕T~DT,缮
}~鈕顮嫴葓\氾s鋾?dZ[崨邙兮誈呎\a酾意u磲3ゥ虰~┐1[Z[|?]泝嚶?眚4?{W[x賷婼谔燥褂阡
盱mB
J?3?
k穇摬$'?淝怂?志-?鋳弋h搘嫻??@熶??找鵶跨??-<?_KsO祶菒硏~S沊)缙碖于?@勾vh?u-旀顤?D龌圳謜鍑+谄7ス肱'k葳鉶JK篃?承哯瀩聫Kr\?靇'壖蠱氌m陡[[Z?
悷?]郇???蝙玛Z彐觧砺荐餠74M燁.m.曋蝨康閨7?恮椙&单{荬演邋袷璝\章dJOQI?4D覊灅H?%#Kt擲x:艒JY??忮緒d~hdd?%螬>棦帵x%审獘RA畉q傑.*颓钮R-?モ钢]琻圞ez絣愰9﹖妇AnH€?澶$琂兏愭<=?i樿踤??昍y耆!薍cj?旂EW匎+~麐鸒?A龝KHg燘*+6`F哠cIZ鄘k?
鑮鵨(卛\b\矶罫榿]€x樐~貿濅?掙?9V踰':?
)?F?
\铄锽sT 曎 ?"绚?
Y伅||嚾+?垑"?2阍C蟚2蔃??? 並I 悶爮TlD靿I騈垘N=+?鞟IN?鮝!炧Ue?
秝<额k咚慩疦
iiH鄘P-#$紑.LCjW ChgV鑟呖醶UAF,詪?谔R耠俾赲狴T耦O鍥?wV4绍?
1uT姀RB枷uR姠秳懵~G?'埣L鳹譡繤沣pF? 芌渹bb!?喢鲌=_\?H?僛JFv#贊$-----------------------------------------------------------------------------
XX.XX.XXX.X->192.168.1.106
Port:80->1634
32位序列号:3920085900
32位确认号:3802158251
urgentPointer:0
4位首部长度:1
6位标志位:ACK楱孶t?|4s銣℉\?4%佇>8???羲岇W魾?牾海  _?佽导杨D氾塓%??2T"m€螊?劤)GNA逵媲=ou佁D聹Sh??y?Ki?.檓弐盨 Y蕣q7嶰鲑? ??^RV??櫊'D{zi啣彶!? y|~?剡?劻鱽]$??? ?3??槔9( 鄜.挺?冄卫e醽f紧Q/减z???>t衻K"?pQ?\餱Q^鋯:芕唩42_恆B綻慁鳫繅 氞T`辞;p??鷞TP晕迈?_烂2濸d?棇詺盪Th;墒^`??B仩唢褊Y勾^:?+91憉?I H?*K?d9愇v惄 0昬轕€?^鹇陏mar闩B~?|.s`?%J脨F ?B傇?筏B`??0?F?}豂t燪 貗 眭覩?h崡聆?{o'?菥郜99?沅 '熽埬??hIs0?骥鶻缜zNf悱蚱澛茀va闢峅ヨd鐚p/燳桍儰Y&鳃z{絸?`眦?3Ux劲]]?  ??z&??€?趮匆? 冕?€摄躵衿z榱f粁覾Y9@??淓肱j魜%yC絭鄱涪-l殖p喕喛?o帪膓滰b兇嚒}?饃轥衏魍fdg僊B
:?#
踓嫨烙?飚z盞z魰?膾Q)kgM?T眲貔!习!?\伻4e}緣貪蕿蕩 軩????o?瘐}!P浖U?域W?f婳~h倰??_荈岽?~O佸聆z|∞@ 膯级xdM沴f伪tt集??6ψ?A鐂8r3lRVV淎?捲沿呻?葡劶让赻?m栴NU鉥跾脍蹮J5T_p鮄?仙兟H?覠挲┺4踔Q?鎀I锻e.唨*vU6雘k98參殢 *c€a懸脹闩壻尹-?W毣K厱 'F鰖飮i黊釉柅耀? h>︱?飡xN?傴t<Q\x?蛽奫媔萳廀n<9f?皟堡1糜x2?輎湥輭%蕷秊>变靗玍VG嗧尞?挜?釛H?j左排煁?KOn!F?瘩???"q}y歋y?R Y輭aI>潘鰵
卧呐?1魄1?鳢偨?息勵麹as8乍k塿?蹫?麥*r睸牐?g?貳
閟頰床甛Z櫖P!姦8駭c曛4uu敂?嫊粼?<捕砆燂? J硨嶆??瘝?Y?隡L愞奘B輝禄簓Ε滄?
崻U蔸Rk0刳醕kM峊顋[郭敶蔶姵au?&,蜕 A芮?@;秾,?痨;?I 鉅銯>?小M7幧qNbG€ 只轮免荏豆? 2+錅%?AQG圗芐8GC

解决方案 »

  1.   

    首先要保证网站传回的是UTF8编码第二保证传回的东西正确,
    自己在保存过程中没有无疑中出错。
    可以用其他工具转换一下,第三你的函数有问题
    int len=MultiByteToWideChar(CP_UTF8, 0, (LPCTSTR)strUtf8, -1, NULL,0); 
    (LPCTSTR)strUtf8 -> 如果你的程序是UNICODE版本,不能直接转换
      

  2.   

    1:Content-Type: text/html;charset=UTF-8
    2:我已经采集过很多次了。而且程序能正常接收其它网页的内容。
    3:像该网站其它网页中的内容“<em>鏍″唴瀛樼煡宸</em>”用我那个转换函数完全可以正常转换。
      

  3.   

    Expires: Thu, 01 Jan 1970 00:00:00 GMT Content-Encoding: gzip Content-Type: text/html;charset=UTF-8 是压缩数据吧,gzip的