如果有一个字符串是这样的:
<a href="http://202.197.120.2/~pwlib/article/list.php">大学物理实验网</a>"
<a href="http://www2.hunnu.edu.cn/download.exe/">下载</a>
<a href="#"> </a>
我只要提取形如第一个“href=...../list.php“的字符出来,而不是后面的两个href语句,有什么办法?

解决方案 »

  1.   

    我找到一篇相关文章,希望对楼主有帮助:
    http://www.codechina.net/dispbbs.asp?boardID=4&ID=4433
      

  2.   

    这个好像不太好判断吧??
    如果链接失效了你怎么判断?表面上仍然是合法链接啊如果你要的功能就是取一个网站所有链接页面
    那可以直接判断最后的文件扩展名
    根据目前的如jsp,asp,aspx,php,html等等来判断
    就是先查"<a href",然后从这里开始查找">",找到后,从">"的位置开始往前查找".",再根据"."与">"中间的字符(就是网页文件扩展名,但要排除如servlet形式的url)来判断是网页还是其他什么东西
      

  3.   

    那可能不行,一个网站有那么多地址,如果每个都去ping的话,估计这个系统什么都做不了
      

  4.   

    为什么不用正则表达式,jdk 1.4提供的java.util.regex库绝对可以方便的解决这个问题。