如:从
<a href="http://classad.163.com/">分类</a> <a href="http://114.163.com/">黄页</a> 
中得到http://classad.163.com和http://114.163.com
其中网址是可变的有可能是形如
http://community.csdn.net/Expert/PostNew.asp?room=5401
是在JAVA里面用的
感谢~~~~~~

解决方案 »

  1.   

    您这个可是有些麻烦可能情况实在太多了吧?
    .net、.com 、.cn、.com.cn、 .tw、 .jp、 .org 有www的没有的还有您上面的那些情况(写的太笼统吧觉着可能有问题 看高手的吧)
    关注ING
      

  2.   

    没有办法的事情,要求就是找出所有的url
      

  3.   

    Pattern pattern = Pattern.compile("<a\\s+href\\s*=\\s*[\"|']?(.*?)['|\"|>]", Pattern.CASE_INSENSITIVE);
    Matcher m = pattern.matcher(pageContents);//pageContents为网页源码