关于webmagic爬取页面乱码问题

小弟最近在爬香港的一些页面，但是爬取出来的页面个别字是乱码，我看了一下这个字在以前是没有收录的，在2016年之后才收录进HKSCS（香港增补字符集）里面，想问一下有没有什么解决方案。我框架用的webmagic，我在site里面设置了编码的
private Site site = Site.me().setSleepTime(forumSpiderSourceUtil.getSleepTime(spiderID))
.setCycleRetryTimes(forumSpiderSourceUtil.getRetryTimes(spiderID))
.setUserAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:53.0) Gecko/20100101 Firefox/53.0")
.setCharset("Big5-HKSCS")
这个charset我用Big5-HKSCS和Big5都试过了，Big5-HKSCS这个要好一点，但是还是有乱码。

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

他们网站也是用的big5编码，我看了的，但是不知道为什么我爬下来就有些乱码

web前台展示框架
在strutstestcase框架下怎样mock出业务层对象
前台打印word 文档
急！高分跪求帮忙！
求救~~~~~
struts2 iterator标签 value值参数化的问题
参数不足，期待是 1。
servlet无法接收"+"字符是怎么回事
请问,资源文件中,\u6b64\u7528 这种编码怎么,转化成汉语(汉字)
org.codehaus.xfire.fault.XFireFault的原因
intellij idea递交项目到码云的时候，为什么out目录没法上传？
IntelliJ IDEA新建Spring Initializr项目，新建好一直报错Unable to import maven project: