有没有比较简单的方法,我用正则表达式,老是要求我添加类,我初学java,有没有高手可以帮我写一个,演示演示。急

解决方案 »

  1.   

    htmlparse这个插件可以完成你所有想要的功能估计lz是想做搜索了吧..哈哈加我邮箱[email protected]我发给你
      

  2.   

    import java.util.regex.*;String baseURL = "http://...............";
    Pattern pattern = Pattern.compile("href=\"(.*)\"",Pattern.CASE_INSENSITIVE);
    Matcher matcher = pattern.matcher(webpage_content);
    while(matcher.find()){
        String foundURL = matcher.group(1);
        if (foundURL.startsWith("http")){
            System.out.println(foundURL);
        }else{
            System.out.println(baseURL + foundURL));
        }
    }
      

  3.   


    //href=http://video.sina.com.cn/>
     //href=http://tv.sohu.com/hdtv >搜狐视频</a>
    //href="http://www.jiayuan.com/st/?id=3237&url=http://www.jiayuan.com" class="f1">
    楼上,这种格式,估计就匹配不出来吧。
      

  4.   

    getElementByTag好像是这么写,自己查去