如:从
<a href="http://classad.163.com/">分类</a> <a href="http://114.163.com/">黄页</a>
中得到http://classad.163.com和http://114.163.com
其中网址是可变的有可能是形如
http://community.csdn.net/Expert/PostNew.asp?room=5401
是在JAVA里面用的
感谢~~~~~~
<a href="http://classad.163.com/">分类</a> <a href="http://114.163.com/">黄页</a>
中得到http://classad.163.com和http://114.163.com
其中网址是可变的有可能是形如
http://community.csdn.net/Expert/PostNew.asp?room=5401
是在JAVA里面用的
感谢~~~~~~
.net、.com 、.cn、.com.cn、 .tw、 .jp、 .org 有www的没有的还有您上面的那些情况(写的太笼统吧觉着可能有问题 看高手的吧)
关注ING
Matcher m = pattern.matcher(pageContents);//pageContents为网页源码