将下列页面中的大、中、小分类匹配出来,该怎么匹配?
http://www.icson.com/category/

解决方案 »

  1.   

    $url    = 'http://www.icson.com/category/';
    $result = file_get_contents($url);
    preg_match_all('/<td width="50%" valign="top">(.*?)<\/td>/s', $result, $rs);
    匹配出大类(含下面的子类),
    再匹配出<dt>手机通讯</dt>,最后是商品<a href="/Items/49--8-1-16-0-1--.html"> MP3和MP4 </a>
    写的够详细了吧。
      

  2.   

    我这样匹配出的大分类模块不全,只匹配出4个,问题出在哪?$preg='/<i>\s<a\shref=\"\/[^>]*\/\">([^<]*)<\/a>\s<\/i>(.*)<i>/sU';        //大分类循环,包含中分类及子分类 
      

  3.   

    下级分类不是直接写在网页代码的,应该是ajax从json(?貌似)获取的
    所以正则不太适用
      

  4.   

    也就是在下面的代码中把所有<i>标签里的内容匹配出来,放在一个数组里                   <td width="50%" valign="top"><i> <a href="/Mobile-Digital/">手机、摄影、数码</a> </i>                        <dl>
                                <dt>手机通讯</dt>
                                <dd> <a href="/Items/311--8-1-16-0-1--.html"> 手机 </a> <a href="/Items/741--8-1-16-0-1--.html"> 对讲机 </a> </dd>
                            </dl>
                            <dl>                            <dt>手机配件</dt>
                                <dd> <a href="/Items/308--8-1-16-0-1--.html"> 手机电池 </a> <a href="/Items/642--8-1-16-0-1--.html"> 手机耳机 </a><a href="/Items/642--8-1-16-0-1--.html"> 蓝牙耳机 </a> <a href="/Items/508--8-1-16-0-1--.html"> 贴膜 </a> <a href="/Items/309--8-1-16-0-1--.html"> 充电器 </a> <a href="/Items/496--8-1-16-0-1--.html"> 数据线 </a> <a href="/Items/1288--8-1-16-0-1--.html"> 移动电源 </a> <a href="/Items/733--8-1-16-0-1--.html"> 车载 </a> <a href="/Items/312--8-1-16-0-1--.html"> 手机套 /外壳 </a> <a href="/Items/1278--8-1-16-0-1--.html"> 手写笔 </a> <a href="/Items/310--8-1-16-0-1--.html"> 挂饰 </a> </dd>                        </dl>
                            <dl>
                                <dt> 摄影摄像</dt>
                                <dd> <a href="/Items/129--8-1-16-0-1--.html"> 数码相机 </a> <a href="/Items/339--8-1-16-0-1--.html"> 单反相机 </a> <a href="/Items/204--8-1-16-0-1--.html"> 镜头 </a> <a href="/Items/130--8-1-16-0-1--.html"> 摄像机 </a> </dd>                        </dl>
                            <dl>
                                <dt> 摄影配件</dt>
                                <dd> <a href="/Items/177--8-1-16-0-1--.html"> 相机包 </a> <a href="/Items/175--8-1-16-0-1--.html"> 相机电池 </a> <a href="/Items/179--8-1-16-0-1--.html"> 贴膜 </a> <a href="/Items/279--8-1-16-0-1--.html"> 滤镜 </a> <a href="/Items/178--8-1-16-0-1--.html"> 三脚架 </a> <a href="/Items/1122--8-1-16-0-1--.html"> 闪光灯 </a> <a href="/Items/176--8-1-16-0-1--.html"> 专业配件 </a> <a href="/Items/323--8-1-16-0-1--.html"> 清洁用品 </a> </dd>                        </dl>
                            <dl>
                                <dt> 数码存储</dt>
                                <dd> <a href="/Items/47--8-1-16-0-1--.html"> 存储卡 </a> <a href="/Items/46--8-1-16-0-1--.html"> U盘 </a> <a href="/Items/230--8-1-16-0-1--.html"> 干电池 </a> <a href="/Items/69--8-1-16-0-1--.html"> 充电电池 </a> <a href="/Items/71--8-1-16-0-1--.html"> 电池套装 </a> <a href="/Items/1379--8-1-16-0-1--.html"> 电池附件 </a> <a href="/Items/48--8-1-16-0-1--.html"> 读卡器 </a> <a href="/Items/--8-1-16-0-1--.html"> 移动硬盘 </a> </dd>                        </dl>
                            <dl>
                                <dt> 娱乐影音</dt>
                                <dd> <a href="/Items/49--8-1-16-0-1--.html"> MP3和MP4 </a> <a href="/Items/194--8-1-16-0-1--.html"> MP3附件 </a> <a href="/Items/313--8-1-16-0-1--.html"> 数码相框 </a> <a href="/Items/--8-1-16-0-1--.html"> 收音/收录机 </a> <a href="/Items/--8-1-16-0-1--.html"> 高清播放器 </a> <a href="/Items/1128--8-1-16-0-1--.html"> 手持电视 </a> <a href="/Items/499--8-1-16-0-1--.html"> 潮流电玩 </a> </dd>                        </dl>
                            <dl>
                                <dt> 学习阅读</dt>
                                <dd> <a href="/Items/998--8-1-16-0-1--.html"> 平板电脑 </a> <a href="/Items/51--8-1-16-0-1--.html"> 电纸书 </a> <a href="/Items/373--8-1-16-0-1--.html"> 录音笔 </a> <a href="/Items/851--8-1-16-0-1--.html"> 电子词典 </a> <a href="/Items/850--8-1-16-0-1--.html"> 点读机 </a> </dd>                        </dl>
                            <dl>
                                <dt> 苹果专区</dt>
                                <dd> <a href="/Items/311--8-1-16-0-1-3590e14574-.html"> iPhone </a><a href="/Items/998--8-1-16-0-1-5191e20841-.html"> iPad </a> <a href="/Items/234--8-1-16-0-1-1360e3703-.html"> imac </a> <a href="/Items/49--8-1-16-0-1-948e14010-.html"> iPod </a> <a href="/Items/234--8-1-16-0-1-1360e3703-.html"> imac </a> <a href="/Items/1531--8-1-16-0-1--.html"> 苹果原装配件 </a> <a href="/Items/1532--8-1-16-0-1--.html"> IPAD配件 </a> <a href="/Items/1533--8-1-16-0-1--.html"> IPHONE配件 </a> <a href="/Items/1534--8-1-16-0-1--.html"> IPOD配件 </a> <a href="/Items/1535--8-1-16-0-1--.html"> IMAC配件 </a> </dd>                        </dl>
                            <div style="clear:both;"></div>
                            <i> <a href="/Home-Garden/">运动、户外、健身</a> </i>
                            <dl>
                                <dt>运动</dt>
                                <dd> <a href="/Items/514--8-1-16-0-1--.html"> 运动鞋 </a> <a href="/Items/972--8-1-16-0-1--.html"> 运动装 </a> <a href="/Items/570--8-1-16-0-1--.html"> 运动配件 </a> </dd>                        </dl>
                            <dl>
                                <dt>体育运动</dt>
                                <dd> <a href="/Items/975--8-1-16-0-1--.html"> 羽毛球 </a> <a href="/Items/974--8-1-16-0-1--.html"> 乒乓球 </a> <a href="/Items/973--8-1-16-0-1--.html"> 篮球 </a> <a href="/Items/993--8-1-16-0-1--.html"> 足球 </a> <a href="/Items/977--8-1-16-0-1--.html"> 排球 </a> <a href="/Items/976--8-1-16-0-1--.html"> 网球 </a> <a href="/Items/1000--8-1-16-0-1--.html"> 棒球 </a> </dd>                        </dl>
                            <dl>
                                <dt>器材保健</dt>
                                <dd> <a href="/Items/1209--8-1-16-0-1--.html"> 健身器械 </a> <a href="/Items/448--8-1-16-0-1--.html"> 运动器材 </a> <a href="/Items/992--8-1-16-0-1--.html"> 运动护具 </a> <a href="/Items/442--8-1-16-0-1--.html"> 卫生急救 </a> <a href="/Items/754--8-1-16-0-1--.html"> 健康秤 </a> <a href="/Items/1313--8-1-16-0-1--.html"> 能量饰品 </a> </dd>                        </dl>
                            <dl>
                                <dt>运动健身</dt>
                                <dd> <a href="/Items/654--8-1-16-0-1--.html"> 游泳用品 </a> <a href="/Items/985--8-1-16-0-1--.html"> 瑜伽用品 </a> <a href="/Items/1221--8-1-16-0-1--.html"> 跆拳道 </a> </dd>                        </dl>
                            <dl>
                                <dt>户外装备</dt>
                                <dd> <a href="/Items/979--8-1-16-0-1--.html"> 户外背包/运动包 </a> <a href="/Items/981--8-1-16-0-1--.html"> 露营用品 </a> <a href="/Items/983--8-1-16-0-1--.html"> 烧烤野炊 </a> <a href="/Items/982--8-1-16-0-1--.html"> 户外桌椅/充气用品 </a> <a href="/Items/450--8-1-16-0-1--.html"> 充气床/沙发</a> <a href="/Items/984--8-1-16-0-1--.html"> 户外工具 </a> <a href="/Items/436--8-1-16-0-1--.html"> 瑞士军刀 </a> <a href="/Items/566--8-1-16-0-1--.html"> 运动水壶 </a> <a href="/Items/753--8-1-16-0-1--.html"> 望远镜 </a> </dd>                        </dl>
                            <dl>
                                <dt>户外鞋服</dt>
                                <dd> <a href="/Items/980--8-1-16-0-1--.html"> 户外服装 </a> <a href="/Items/978--8-1-16-0-1--.html"> 户外运动鞋 </a> <a href="/Items/987--8-1-16-0-1--.html"> 户外配饰 </a> </dd>                        </dl>
                            <div style="clear:both;"></div>
                            <i> <a href="/Home-Garden/">礼品、玩具、乐器</a> </i>
                            <dl>
                                <dt>礼品礼券</dt>
                                <dd> <a href="/Items/934--8-1-16-0-1--.html"> 火机烟具 </a> <a href="/Items/555--8-1-16-0-1--.html"> 高档笔具 </a> <a href="/Items/436--8-1-16-0-1--.html"> 瑞士军刀 </a> <a href="/Items/759--8-1-16-0-1--.html"> 相册相框 </a> <a href="/Items/1002--8-1-16-0-1--.html"> 礼券 </a> </dd>                        </dl>
                            <dl>
                                <dt>玩具</dt>
                                <dd> <a href="/Items/758--8-1-16-0-1--.html"> 遥控玩具 </a> <a href="/Items/760--8-1-16-0-1--.html"> 模型玩具 </a> <a href="/Items/757--8-1-16-0-1--.html"> 益智玩具 </a> <a href="/Items/1204--8-1-16-0-1--.html"> 毛绒公仔 </a> <a href="/Items/1004--8-1-16-0-1--.html"> 婴童感官 </a> <a href="/Items/1393--8-1-16-0-1--.html"> 婴童综合 </a> <a href="/Items/1395--8-1-16-0-1--.html"> 少儿益智 </a> </dd>                        </dl>
                            <dl>
                                <dt>乐器</dt>
                                <dd> <a href="/Items/877--8-1-16-0-1--.html"> 电子琴 </a> <a href="/Items/841--8-1-16-0-1--.html"> 吉他 </a> <a href="/Items/1212--8-1-16-0-1--.html"> 西洋乐器 </a> <a href="/Items/1214--8-1-16-0-1--.html"> 民族乐器 </a> <a href="/Items/1217--8-1-16-0-1--.html"> 学生乐器 </a> <a href="/Items/1216--8-1-16-0-1--.html"> 乐器配件 </a> </dd>                        </dl></td>
      

  5.   

    更正一下,是两个相邻的<i>标签对之间的内容,例如:
    <i> <a href="/Mobile-Digital/">手机、摄影、数码</a> </i>

    <i> <a href="/Home-Garden/">运动、户外、健身</a> </i>
    之间的所有内容
      

  6.   

    hello!!1楼和楼主,很久不见咯!
      

  7.   

    你意思还是没表达清楚!标签之间的部分包括<a src='xxxxxx'>这样的地址么~~
      

  8.   

    先展示一下我的代码应用
    $url = 'http://www.icson.com/category/';$p = new HTMLDocument($url);
    foreach($p->find('a') as $v) {
      $t = $v->href;
      if($t{0} == '/')
        echo "$t," . trim($v->innerHTML) . PHP_EOL;
    }/category/,<h2>全部商品分类</h2>
    /Items/311--8-1-16-0-1--.html,手机
    /Items/741--8-1-16-0-1--.html,对讲机
    /Items/308--8-1-16-0-1--.html,手机电池
    /Items/642--8-1-16-0-1--.html,手机耳机
    /Items/214--8-1-16-0-1--.html,蓝牙耳机
    /Items/508--8-1-16-0-1--.html,贴膜
    /Items/309--8-1-16-0-1--.html,充电器
    /Items/496--8-1-16-0-1--.html,数据线
    /Items/1288--8-1-16-0-1--.html,移动电源
    /Items/733--8-1-16-0-1--.html,车载
    /Items/312--8-1-16-0-1--.html,手机套/外壳
    /Items/1278--8-1-16-0-1--.html,手写笔
    /Items/310--8-1-16-0-1--.html,挂饰
    /Items/129--8-1-16-0-1--.html,数码相机
    /Items/339--8-1-16-0-1--.html,单反相机
    /Items/204--8-1-16-0-1--.html,镜头
    /Items/130--8-1-16-0-1--.html,摄像机
    /Items/177--8-1-16-0-1--.html,相机包
    /Items/175--8-1-16-0-1--.html,相机电池
    /Items/179--8-1-16-0-1--.html,贴膜
    /Items/279--8-1-16-0-1--.html,滤镜
    /Items/178--8-1-16-0-1--.html,三脚架
    /Items/1122--8-1-16-0-1--.html,闪光灯
    /Items/176--8-1-16-0-1--.html,专业配件
    /Items/323--8-1-16-0-1--.html,清洁用品
    /Items/47--8-1-16-0-1--.html,存储卡
    /Items/46--8-1-16-0-1--.html,U盘
    /Items/230--8-1-16-0-1--.html,干电池
    /Items/69--8-1-16-0-1--.html,充电电池
    /Items/71--8-1-16-0-1--.html,电池套装
    /Items/1379--8-1-16-0-1--.html,电池附件
    /Items/48--8-1-16-0-1--.html,读卡器
    /Items/128--8-1-16-0-1--.html,移动硬盘
    /Items/49--8-1-16-0-1--.html,MP3和MP4
    /Items/194--8-1-16-0-1--.html,MP3附件
    /Items/313--8-1-16-0-1--.html,数码相框
    /Items/747--8-1-16-0-1--.html,收音/收录机
    /Items/347--8-1-16-0-1--.html,高清播放器
    /Items/1128--8-1-16-0-1--.html,手持电视
      

  9.   

    e....楼上用的不是正则了!dom!
    不过思路不错!