大家好,我初次使用regular expression,想抓下网页原始码中可以正常使用的连结,目前抓一般的连结标签可以,但尚无法解决遇到<xmp>和注解(<!-- -->)的情形。请问我该怎样使用regular expression让他避开被<xmp></xmp>或<!-- -->包住的连结??
我是使用xmlHTTP.responseText的方式抓下整个网页的原始码,本想用replace把被<xmp></xmp>或注解包住的内容都换成空字串,但发现responseText似乎不支援replace,况且并不是很了解responseText究竟是什么样的格式。麻烦各位解答,非常感谢!