把网页下回来按标签<a href取咯,到>或者"结束

解决方案 »

  1.   

    对所有在sina.com.cn服务器的html,htm,....文件进行遍历,找到所有的超连接(既gdsean(摇滚java)所说的<a href ... ></a>)
      

  2.   

    那不是一个巨大的递归过程???????关键是如何得到所有的html,htm等文件,难道非要先把网页文件读取下来,再对其内容进行分析???那效率会不会很差???
      

  3.   

    真的吗???那我可有巨大的任务要完成了,希望各位多多交流
    [email protected]