现在想找一份全国高等院校名单,
要求 有省份、学校名称,
在网上只找到一个网页,求大虾们帮忙提取一下信息
http://www.zmdedu.net/read.asp?id=684&tepy=tb_kaoshi就是里面“2010年具有高等学历教育招生资格的高等学校名单”的数据都帮忙抓取一下

解决方案 »

  1.   

    $url = 'http://gaokao.chsi.com.cn/gkxx/gxmd/zige/201004/20100429/75000571-1.html';
    $s = file_get_contents($url);
    preg_match('#<p>.+</p>#is', $s, $reg);
    echo strip_tags($reg[0]);$url 中的红色的字符是页面序号,取值范围 1 - 31
      

  2.   

    最简单的话可以用WinInet类来抓,具体可以用看看MSDN.不用考虑socket之类的东东,直接使用http协议即可.
    但传回来的全是web的html码,对具体内容自己应该还要筛选
      

  3.   

    上次抓取网页数据是用的htmlsql和simple_html_dom
    感觉蛮有意思