哎哟这不是送分吗,真不好意思要呢。>:D

解决方案 »

  1.   

    int preg_match_all ( string pattern, string subject, array matches [, int flags])
    在 subject 中搜索所有与 pattern 给出的正则表达式匹配的内容并将结果以 flags 指定的顺序放到 matches 中。 搜索到第一个匹配项之后,接下来的搜索从上一个匹配项末尾开始。
      

  2.   

    <?
    $content='<html><head>
    ...
    <br><br>';
    $pattern='/<td><font face="verdana,sans-serif" size=1>[&nbsp;|\s]+(\d+)<\/td>\s+<td>&nbsp;<a href="([^\"]+)"><font face="verdana,sans-serif" size=1 color=#000000>([^<]+)<\/a><\/td>/i';
    preg_match_all($pattern,$content,$matches,PREG_PATTERN_ORDER);
    print_r($matches);
    ?>
      

  3.   

    <font face="verdana,sans-serif" size=1>[&nbsp;|\s]
    不是固定的
      

  4.   

    只有<TD>是固定的,但是不能讀取第一個表格的<TD>
      

  5.   

    代码少并不就是效率高
    <?php
    $text = <<< EOT
    <html><head>
    <title>关键词</title>
    <style TYPE="text/css">
    <!--
      A {text-decoration:none;}
      A:hover {text-decoration:underline;}
    -->
    </style>
    </head>
    <body bgcolor=#FFFFFF onLoad="window.focus(); if(document.stst.term != null) document.stst.term.focus();">
    <form action="" method="POST" target="_top" name="stst">
    <center>
    <table border=0 width="270" border=0 cellspacing=0 cellpadding=4 bgcolor=#FFFFFF>
    <tr>
      <td align=left><br/>
        汉字<br/>
        <p><input type=hidden name=mkt value="tw">
          <input type=hidden name=lang value="zh_TW">
          <input type=text name=term size=20 value="">
          <input type=image border=0 src=/images/shared/b.gif width=17 height=18 align=absmiddle>
    </p>
    <li>
      <p><font face="verdana,sans-serif" size=1><b>汉字</b></td></tr></table>
    </form>
    <script language="Javascript">
      var s_pageName = document.title;
    </script>
    <script language="Javascript" src="http://www.overture.com/d/global/s_code_remote.js"></script><table border=0 cellpadding=1 cellspacing=0 bgcolor=#FFFFFF width=270>
      <tr align=left bgcolor=#0066CC>
      <th colspan=2><font face="verdana,sans-serif" size=2 color=E8E8E8>汉字标题</font></th>
      </tr>
      <tr align=left bgcolor=#999999>
        <th><font face="verdana,sans-serif" size=2 color=E8E8E8>数字</font></th>
        <th><font face="verdana,sans-serif" size=2 color=E8E8E8>字符串</font></th>
      </tr>
    <tr>
    <td><font face="verdana,sans-serif" size=1> 4</td>
    <td> <a href="#"><font face="verdana,sans-serif" size=1 color=#000000>汉字1</a></td>
    </tr>
    <tr bgcolor="#F4F4F4">
    <td><font face="verdana,sans-serif" size=1> 2</td>
    <td> <a href="#"><font face="verdana,sans-serif" size=1 color=#000000>汉字2</a></td>
    </tr>
    <tr>
    <td><font face="verdana,sans-serif" size=1> 3</td>
    <td> <a href="#"><font face="verdana,sans-serif" size=1 color=#000000>汉字3</a></td>
    </tr>
    <tr>
    <td><font face="verdana,sans-serif" size=1> 5</td>
    <td> <a href="#"><font face="verdana,sans-serif" size=1 color=#000000>汉字5</a></td>
    </tr>
    <tr bgcolor="#F4F4F4">
    <td><font face="verdana,sans-serif" size=1> 1</td>
    <td> <a href="#"><font face="verdana,sans-serif" size=1 color=#000000>汉字6</a></td>
    </tr>
    <tr>
    <td><font face="verdana,sans-serif" size=1> 6</td>
    <td> <a href="#"><font face="verdana,sans-serif" size=1 color=#000000>汉字7</a></td>
    </tr>
    </table>
    <br/><br/>
    EOT;$text = strip_tags($text, '<a><td>'); //去除不要的标记
    $text = preg_replace("/[\r\n ]+|&nbsp;/", '', $text); //去除空格和换行符
    preg_match_all('/<td>(\d+)<\/td><td><ahref=(.+)>(.+)<\/a><\/td>/iU', $text, $r); //这个规则串也不简单
    print_r($r);
    ?>