目的:将南京邮电大学学报页面中的所有表单过滤出来
代码:
String url="http://nyzr.njupt.edu.cn/ch/index.aspx";//学报地址
Parser parser = new Parser();
parser.setURL(url);
parser.setEncoding("GB2312");
NodeList form_list = parser .extractAllNodesThatMatch(new NodeClassFilter(FormTag.class));// 过滤出Form节点
可是发现始终无法过滤出form节点,但是过滤title节点就可以猜想是页面的问题吧?这个过滤方法我用在很多页面上都可以成功过滤的啊附学报页面的html代码:学报页面代码过长,无法贴上来
请高人赐教,
代码:
String url="http://nyzr.njupt.edu.cn/ch/index.aspx";//学报地址
Parser parser = new Parser();
parser.setURL(url);
parser.setEncoding("GB2312");
NodeList form_list = parser .extractAllNodesThatMatch(new NodeClassFilter(FormTag.class));// 过滤出Form节点
可是发现始终无法过滤出form节点,但是过滤title节点就可以猜想是页面的问题吧?这个过滤方法我用在很多页面上都可以成功过滤的啊附学报页面的html代码:学报页面代码过长,无法贴上来
请高人赐教,
我想同时加两个过滤器有什么不行?
看看要进行第二次过滤时,from是否还在