你是要把内容切割,然后给url标识下就可以了

解决方案 »

  1.   

    以python为例
    1)先定义匹配规则
    patt = re.compile(r"""\s<tr>\n\s<td>(.*)</td>\n\s<td bgcolor="#000000">(.*)</td>\n\s</tr>\n""", re.VERBOSE)2) 定义解析一行文本内容的函数
    def LineAnalisys(line):
        trow = re.match(patt, line)
        col1, clo2 = trow.group(1), trow.group(2)
        return (col1, clo2)3) 逐行读取文件,并解析
    sourceFile = "thefile.html"
    for line in open(sourceFile,"r").readlines():
        (col1, clo2) = LineAnalisys(line)
      

  2.   


    <?php$str = "<table width='100%' border='1' cellspacing='1' cellpadding='0'> 
      <tr> 
        <td>aaa </td> 
        <td bgcolor='#000000'>111 </td> 
      </tr> 
      <tr> 
        <td>bbb </td> 
        <td bgcolor='#000000'>222 </td> 
      </tr> 
      <tr> 
        <td>ccc </td> 
        <td bgcolor='#000000'>333 </td> 
      </tr> 
    </table> 
    ";preg_match_all("/<td>([^>]+)<\/td>/iUs", $str, $out, PREG_SET_ORDER);print_r($out);?>
      

  3.   

    已经解决了,$content=explode($end,$content[1]); 
    把这个1放入循环读出来就可以了,多谢各位关注,来者有分。