$pattern="/(HREF=.*<\/A><TABLE)/";$url_out_patternl="/(\/XWTJJxxxsh\.ycs\?GUID=[\d]{6,})/i";$out_pre="http://tjj.bjxw.gov.cn";$contents=@file_get_contents("http://tjj.bjxw.gov.cn/XWTJJsjcx/XWTJJsjcxtjgb.ycs");
preg_match_all($pattern,$contents,$outurl);
foreach($outurl[1] as $url){
if(in_array($url,$nums)){
continue;
}
$nums[]=$url;
$title=strip_tags($url);
echo $title."</br>";
}部分结果:
HREF="/XWTJJxxxsh.ycs?GUID=452368">2008年国民经济和社会发展统计公报
HREF="/XWTJJxxxsh.ycs?GUID=438783">2007年国民经济和社会发展统计公报我想把中文部分提取出来