[[email protected]][/email]
上次在论坛里得到一兄弟帮忙把baidu的结果页面对应的正则表达式写出来了,如下:
String reg = "<h2 class=r>.*?" +
         "<a.*? href=\"(.*?)\".*?>(.*?)</a>.*?</h2>";
        Pattern p = Pattern.compile(reg,Pattern.CASE_INSENSITIVE | Pattern.DOTALL);
        Matcher m = p.matcher(str_1);
        
        int i = 1;

        while(m.find())
        {
         //直接在得到title和link的时候写入数据库?
         title=m.group(2).replaceAll("<.*?>", "");//正则表达式
         link=m.group(1);
        ......
        }小弟照猫画虎,把google的写成这样:
String reg = "<h2 class=r>.*?" +
                "<a.*? href=\"(.*?)\".*?>(.*?)</a>.*?</h2>";下边的部分和百度的一致,为什么就不能抓取到内容呢?请路过的大虾小虾都帮帮忙。谢谢。