用HttpURLConnection从一个网页里面取出一段JS代码,里面的汉字经过编码的,请教如何转换
如:\u7cbe\u9009\u8f91

解决方案 »

  1.   

    是不是要将汉字转换为Unicode码的问题么
    请参照struts中有关国际话的问题
      

  2.   

    System.out.println("\u7cbe\u9009\u8f91");//\u7cbe\u9009\u8f91就是unicode码,打印出来直接就是中文
      

  3.   

    最简单的就是使用java自带的转换工具native2ascii.exe,你的jdk文件夹下面有,或者网上搜转换的代码
      

  4.   

    对呀,用native2ascii.exe就可以,我经常转换日文编码就用它
      

  5.   

    同意jiqi62120() ~~~~~~~~~
    native2ascii是将中文转换为Unicode码
      

  6.   

    恩,楼主可以试试  native2ascii -reverse 原文件名 目标文件名  
    我今天刚做过,不过是把gbk转iso-8859-1 用的是native2ascii -encoding gbk 
    对于这个问题也不是很清楚,有高手具体讲一哈?
      

  7.   

    有几天不来看,不好意思啊,各位,楼上的我都知道,关键是爬虫从网页上抓下来的就是\u7cbe\u9009\u8f91这样的字符,所以用System.out.print打出来的,也不会是汉字,所以我才要转换的啊
      

  8.   

    也就是说,那字符在内存中的状态是\\u7cbe\\u9009\\u8f91这样的,所以打印出来就成了\u7cbe\u9009\u8f91这样的字符了