急急急~~哪个大哥不吝啬赐教!在下感激不尽!

解决方案 »

  1.   

    这个是我拷贝的、貌似很老的方法  不过还好用  
    import org.htmlparser.Node;  
    import org.htmlparser.NodeFilter;  
    import org.htmlparser.Parser;  
    import org.htmlparser.tags.LinkTag;  
    import org.htmlparser.util.NodeList;  
      
    /** 
     * 
     * @author [email protected] 
     */  
    public class GetLinkTest {  
      
        public static void main(String[] args) {  
      
            try {  
                // 通过过滤器过滤出<A>标签   
                Parser parser = new Parser("http://forum.csdn.net/PointForum/Forum/TopicList.aspx?Alias=Java_WebDevelop&ListType=UnClosedList&page=5");  
                NodeList nodeList = parser.extractAllNodesThatMatch(new NodeFilter() {  
                    // 实现该方法,用以过滤标签   
                    public boolean accept(Node node) {  
                        if (node instanceof LinkTag)// 标记   
                        {  
                            return true;  
                        }  
                        return false;  
                    }  
                });  
                // 打印   
                for (int i = 0; i < nodeList.size(); i++) {  
                    LinkTag n = (LinkTag) nodeList.elementAt(i);  
                    System.out.print(n.getStringText() + " ==>> ");   
                    System.out.println(n.extractLink());   
                    try {  
                        if (n.extractLink().equals("http://forum.csdn.net/PointForum/Forum/TopicList.aspx?Alias=Java_WebDevelop&ListType=UnClosedList&page=5")) {  
                            System.out.println("***"+n.extractLink());  
                        }  
                    } catch (Exception e) {  
                    }  
                }  
            } catch (Exception e) {  
                e.printStackTrace();  
            }  
      
        }  
    }  
      

  2.   

    需要的jar包的名字也都给了  去下就是了、
    吃饭
      

  3.   

    试了就知道了啊、
    这个达不到你需求
    可以百度  java网页蜘蛛  或者 java网页爬虫
    核心是 htmlparser  还有一个jar  htmlclean 吧?