爬虫抓取页面存数据库,但是部分记录内容有问题,查看数据库中内容显示为一个问号?
然后从数据库读该字段数据作为XML节点内容,其内容为乱码,XLST格式显示的时候就出错误。对乱码无法识别。报的错误:“”(十六进制值 0x1F)是无效的字符。 行 158,位置 27。 我想在读数据库字段数据的时候做处理,如果该字段数据就是有乱码的话,全部有清空做空字符串处理。不知道大家有没有办法实现。想破头了都没办法想处理。

解决方案 »

  1.   

    先看看从数据库读出来的字符串是个什么东西?不要先读为XML节点内容..然后再看看有没有什么共性,有什么办法处理没有
      

  2.   

    数据库中读出的数据 用print处理是一堆乱码出来,我想复制进来给大家看,但是复制后粘贴的结果就是一个?而已检测乱码,在?前还有一个不可见字符猜测就是十六进制值 0x1F)该无效的字符。不知道如何处理,判断读出的数据是含有这种无效字符的???请大家帮忙
      

  3.   

    使用BASE64重新编码吧,然后读出来在解码。
    System.Convert.ToBase64String、FromBase64String 
      

  4.   

    道理很简单,但是方法却很笨。
    判断数据字段中的字符ASCII码是否可见就可以了。如果有不可见的就是有乱码的。