想做个蜘蛛,找到DownloadURLToFile这个函数,速度还比较快,但是有些下载后转存的html用IE打开时是乱码,用“记事本”打开就正常,“记事本”转存后IE打开也正常,为什么啊?

解决方案 »

  1.   

    那些乱码html估计很多是UTF-8编码的
      

  2.   

    谢谢
    vb 能自动根据字节码判断字符类型吗?
    怎么能自动判断网页的编码?
    (后来发现我试验的那个网页写着charset=GB2312,其实是utf-8的,因为通过一段读utf-8代码读出来就就没有乱码了,这种情况怎么处理)
      

  3.   

    建议好好研究下这个东西          IsTextUnicode?  应该是这么拼吧... 我记得是 advxx.dll 里面的导出函数,记事本也用他判断字符编码