本帖最后由 PhpNewnew 于 2012-04-30 21:04:37 编辑

解决方案 »

  1.   

    花8小时,搜集了150多万条记录,正在逐渐优化中。数据库都有500M了,用phpmyadmin导不进,用mysql命令导到100万条左右也出错。重新过滤再搜集。。
      

  2.   

     strip_tags  这个好用
    preg_match_all('/<d[dt][^>]*>(?:<span>(.*?):<\/span>)?(?:<span[^>]*>)?(.*?)(?:<\/span>)?<\/d[dt]>/m',$str,$matches);这条详细好多
      

  3.   

    preg_match_all('/<d[dt][^>]*>(?:<span>(.*?):<\/span>)?(?:<span[^>]*>)?(.*?)(?:<\/span>)?<\/d[dt]>/m',$str,$matches);
    //preg_match_all('/<\/span>(.*?)<\/dd>|<dt>(.*)<\/dt>/m',$str,$matches);
    //print_r($matches[2]);
    $contact=$matches[2][1];$web=$matches[2][1];$Fax=$matches[2][3];$tel=$matches[2][4];
    $email=$matches[2][5];$addr=$matches[2][6];