如果有一个字符串是这样的:
<a href="http://202.197.120.2/~pwlib/article/list.php">大学物理实验网</a>"
<a href="http://www2.hunnu.edu.cn/download.exe/">下载</a>
<a href="#"> </a>
我只要提取形如第一个“href=...../list.php“的字符出来,而不是后面的两个href语句,有什么办法?
<a href="http://202.197.120.2/~pwlib/article/list.php">大学物理实验网</a>"
<a href="http://www2.hunnu.edu.cn/download.exe/">下载</a>
<a href="#"> </a>
我只要提取形如第一个“href=...../list.php“的字符出来,而不是后面的两个href语句,有什么办法?
http://www.codechina.net/dispbbs.asp?boardID=4&ID=4433
如果链接失效了你怎么判断?表面上仍然是合法链接啊如果你要的功能就是取一个网站所有链接页面
那可以直接判断最后的文件扩展名
根据目前的如jsp,asp,aspx,php,html等等来判断
就是先查"<a href",然后从这里开始查找">",找到后,从">"的位置开始往前查找".",再根据"."与">"中间的字符(就是网页文件扩展名,但要排除如servlet形式的url)来判断是网页还是其他什么东西