我从一个url取网页内容,然后再从中提取需要的内容网页内容:var fd_list = new Array();
 fd_list[1]=new Array();
fd_list[1][1]="企业名称";
fd_list[1][2]="某有限公司";
我要取里面里面的中文
beginStr= "fd_list[1][2]=\""endStr="\""
String regex = beginStr + ".*" + endStr;
Pattern pt = Pattern.compile(regex);
Matcher mt = pt.matcher(sourceContent);

List resultList = new ArrayList();
while (mt.find()) {
String result = mt.group();
result.replaceAll(beginStr, "");
result.replaceAll(endStr, "");
resultList.add(mt.group());
}
return resultList;这里mt find不到,不进入循环,是哪里的问题?

解决方案 »

  1.   

    Matcher mt = pt.matcher(sourceContent);
    sourceContent在哪里?
      

  2.   

    sourceContent就是网页的内容我现在这样写: "fd_list\\[2\\]\\[2\\]=\""每人中括号月前加两个\\,可以出来东西,但好象取得不太对
      

  3.   

    String regex = beginStr + ".*[^\"]" + endStr;我改成这样还是不对,后面的引号直接取到了网页最后一个引号
      

  4.   

    [\\u4e00-\\u9fa5]这个应该是匹配中文的吧
      

  5.   

    我现在是这样写的,可以了
    String regex = beginStr + ".[^\"]*" + endStr;原来的写法没有去掉前面的“,所以不对我也在其它地方看到加?,但发现去掉也行,请教这个?的作用