<TD HEIGHT="30"><font color="#FF0000"><b>【推荐】</b></font><A TARGET="_blank" HREF="../wqst/66400.html" ONCLICK="return ListensSt(this.href);">【<font color=red><b>六步</b></font>】我的新娘在草原</A></TD>我要提取里面的中文出来,该怎么写正则表达式呢?就是要提取:【推荐】【六步】我的新娘在草原
忘路过大神帮忙!!!

解决方案 »

  1.   

    import org.jsoup.Jsoup;
    import org.jsoup.nodes.Document;String text = "<TD HEIGHT=\"30\"><font color=\"#FF0000\"><b>【推荐】</b></font><A TARGET=\"_blank\" HREF=\"../wqst/66400.html\" ONCLICK=\"return ListensSt(this.href);\">【<font color=red><b>六步</b></font>】我的新娘在草原</A></TD>";Document doc = Jsoup.parseBodyFragment(text);String result = doc.select("b").get(0).text() + doc.select("a").get(0).text(); // 【推荐】【六步】我的新娘在草原
      

  2.   

    [Quote=引用 1 楼 huntor 的回复:]
    我用的是小众语言,不支持这种DOM操作的~请帮忙正则提取啊啊啊啊!
    全文是:<TR BGCOLOR="#F7F7F7" ONMOUSEOVER="sbar(this)" ONMOUSEOUT="cbar(this)">        <TD ALIGN="center" HEIGHT="30" WIDTH="3%"><INPUT TYPE="checkbox" NAME="gqid" VALUE="66400"></TD>        <TD ALIGN="center" HEIGHT="30" WIDTH="11%">(QT)1143</TD>        <TD HEIGHT="30"><font color="#FF0000"><b>【推荐】</b></font><A TARGET="_blank" HREF="../wqst/66400.html" ONCLICK="return ListensSt(this.href);">【<font color=red><b>六步</b></font>】我的新娘在草原</A></TD>        <TD ALIGN="center" HEIGHT="30" WIDTH="11%"><font color=red><b>六步</b></font></TD>        <TD ALIGN="center" HEIGHT="30" WIDTH="9%">7分40秒</TD>        <TD ALIGN="center" HEIGHT="30" WIDTH="5%">3币</TD>        <TD ALIGN="center" HEIGHT="30" WIDTH="5%">高清</TD>        <TD ALIGN="center" HEIGHT="30" WIDTH="5%"><A TARGET="_blank" HREF="../wqst/66400.html" ONCLICK="return ListensSt(this.href);"><IMG BORDER="0" SRC="../Images/st.gif"></A></TD>        <TD ALIGN="center" HEIGHT="30" WIDTH="5%"><A TARGET="_blank" HREF="../mp3st/66400.html" ONCLICK="return ListensSt(this.href);"><IMG BORDER="0" SRC="../Images/jd.gif"></A></TD>        <TD ALIGN="center" HEIGHT="30" WIDTH="5%"><A TARGET="_blank" HREF="../wqxz.asp?gqid=66400" ONCLICK="return ListensXz(this.href);"><IMG BORDER="0" SRC="../Images/xz.gif"></A></TD>        <TD ALIGN="center" HEIGHT="30" WIDTH="5%"><A TARGET="_blank" HREF="../gwc.asp?action=dg&dgid=66400" ONCLICK="return ListensDd(this.href);"><IMG BORDER="0" SRC="../Images/gwc.gif"></A></TD>        <TD ALIGN="center" HEIGHT="30" WIDTH="5%"><A TARGET="_blank" HREF="../user.asp?action=box&scid=66400" ONCLICK="return ListenSc(this.href);"><IMG BORDER="0" SRC="../Images/sc.gif"></A></TD>      </TR>
    需要提取出:【推荐】【六步】我的新娘在草原
      

  3.   

    凑个热闹。 String text = "<TD HEIGHT=\"30\"><font color=\"#FF0000\"><b>【推荐】</b></font><A TARGET=\"_blank\" HREF=\"../wqst/66400.html\" ONCLICK=\"return ListensSt(this.href);\">【<font color=red><b>六步</b></font>】我的新娘在草原</A></TD>";
    for (char c : text.toCharArray())
    if (c>0x1000) System.out.print(c);  //算上标点符号
      

  4.   

    这也不行,那这个呢?标准正则啊:
    String text = "<TD HEIGHT=\"30\"><font color=\"#FF0000\"><b>【推荐】</b></font><A TARGET=\"_blank\" HREF=\"../wqst/66400.html\" ONCLICK=\"return ListensSt(this.href);\">【<font color=red><b>六步</b></font>】我的新娘在草原</A></TD>";
    String regExp = "[\\u1000-\\uFFFF]*";
    Matcher m=Pattern.compile(regExp).matcher(text);
    while (m.find()) System.out.print(m.group(0));