例如这段代码:
<TABLE width="100%" border="0" cellPadding="0" cellSpacing="0" xmlns:fo="http://www.w3.org/1999/XSL/Format">
  <TR>
    <TD height="28">
      <font class="h6">高级客户经理
(2人)
</font>
      <br>青牛(北京)技术有限公司<A href="#22200200880523">(查看公司信息)</A><br><img src="images/none.gif" width="1" height="3" border="0"></TD>
  </TR>
  <TR>
    <TD>
      <TABLE width="98%" border="0" cellPadding="0" cellSpacing="0" bgcolor="#ffffff">
        <tr>
          <td colspan="3">
            <img src="images/none.gif" width="1" height="10" border="0">
          </td>
        </tr>
        <TR>
          <TD width="34%">
            <font class="h8">
              <strong>工作性质:</strong>全职</font>
          </TD>
          <TD width="34%">
            <font class="h8">
              <strong>工作地点:</strong>
              <INPUT TYPE="hidden" NAME="job_loc" VALUE="杭州">杭州&nbsp; </font>
          </TD>
我希望得到 高级客户经理(2人)、工作性质、工作地点等信息。
望有经验的给个建议。
比较好的方法,欢迎跟贴。

解决方案 »

  1.   

    找到<font class="h6">
    然后再找到后边第一个<,取中间的值,得到“高级客户经理(2人)”
    然后继续...
      

  2.   

    不行啊,在整个页面中<font class="h6">不止一处的啊。
      

  3.   

    请楼上的具体指导,我菜啊。如何提取这个字符串???
     <TR>
        <TD height="28">
          <font class="h6">高级客户经理
               (2人)
             </font>
          <br>青牛(北京)技术有限公司<A href="#22200200880523">(查看公司信息)</A><br><img src="images/none.gif" width="1" height="3" border="0"></TD>
      </TR>
    在上面格式的字符串中,如何提取出 高级客户经理(2人) 这样的字符串?<TD height="28">是这个网页代码中唯一的,<font class="h6">则不是唯一。望大家知道下,我急用的。
    分不够,下次补!!!
      

  4.   

    看完暂时的一个想法:找到<font class="h6">.取后面所要的字符串.然后把前面的字符串删除.重复执行.也就是:取得第一个所要的字符串后.把所取得的字符串前面的全部删除.再去找