<table width='100%' class=gridtable cellpadding='0' cellspacing='0'>      
      <tr><td class=th><a href='/id/131833'>กร๋องกร๋อย</a></td><td>graawng<span class='tt'>R</span> graawy<span class='tt'>R</span></td><td class=pos>&nbsp;</td><td>[alternate spelling of <a class='tz' href='/id/139223' ttid='3'>กร็อกกร๋อย</a> <a onClick=PlayAudioFile('mms://media.000000.com/audio/E139223.wma') style='cursor:pointer;'><img src='/img/speaker_sm.gif' /></a>]</td></tr>
      
      <tr><td class=th><a href='/id/148597'>กร่องแกร่ง</a></td><td>graawng<span class='tt'>L</span> graeng<span class='tt'>L</span></td><td class=pos>adjective</td><td>weak; feeble</td></tr>
            
      
      <tr><td rowspan=2 class=th><a href='/id/139224'>กรอด</a> <a onClick=PlayAudioFile('mms://media.000000.com/audio/E139224.wma') style='cursor:pointer;'><img src='/img/speaker_sm.gif' /></a></td><td rowspan=2>graawt<span class='tt'>L</span></td><td class=pos>adjective</td><td>thin; lean; waif-like; impoverished; scrawny; puny</td></tr>    <tr><td class=pos>verb</td><td>to gnash; to grate</td></tr>
      
      
      <tr><td class=th><a href='/id/134217'>กร่อน</a> <a onClick=PlayAudioFile('mms://media.000000.com/audio/E134217.wma') style='cursor:pointer;'><img src='/img/speaker_sm.gif' /></a></td><td>graawn<span class='tt'>L</span></td><td class=pos>verb</td><td>to corrode; wear down; be eroded</td></tr>
      
      
      <tr><td class=th><a href='/id/230163'>กร่อนเซาะ</a></td><td>graawn<span class='tt'>L</span> saw<span class='tt'>H</span></td><td class=pos>verb</td><td>to erode</td></tr>
      
      <tr><td rowspan=5 class=th><a href='/id/133546'>กรอบ</a> <a onClick=PlayAudioFile('mms://media.000000.com/audio/E133546.wma') style='cursor:pointer;'><img src='/img/speaker_sm.gif' /></a></td><td rowspan=5>graawp<span class='tt'>L</span></td><td class=pos>adjective</td><td>[of taste-texture] [is] crisp; crispy</td></tr>
      <tr><td class=pos>noun</td><td>frame; border; margin; edge</td></tr>      
      <tr><td class=pos>adjective</td><td>[is] brittle; fragile; breakable</td></tr>
      <tr><td class=pos>adverb</td><td>very; extremely</td></tr>      
      <tr><td class=pos>classifier</td><td>[numerical classifier for frame]</td></tr>
      
      
      <tr><td class=th><a href='/id/220539'>กรอบเช็ดหน้า</a></td><td>graawp<span class='tt'>L</span> chet<span class='tt'>H</span> naa<span class='tt'>F</span></td><td class=pos>noun</td><td>frame; window or door frame</td></tr>      
      </tr></table>

解决方案 »

  1.   


    要求,如上图.采集的数据为批量采集,
    不能有其他杂七杂八的代码.代码不是很规则,采集有些难度.
    需要用正则表达式才能解决这个问题.用(?<content>[\s\S]*?)这个采集.
      

  2.   

    也不说采集什么,就当你采集流媒体吧
    #กรอด</a>\s*<a onClick=PlayAudioFile\('([^']+)'#uiU
    #กร่อน</a>\s*<a onClick=PlayAudioFile\('([^']+)'#uiU
      

  3.   

    preg_match_all('#<tr><td.*>(.*)</td><td.*>(.*)</td><td.*>(.*)</td><td.*>(.*)</td></tr>#isU', $s, $r);
      

  4.   


    兄弟,请看1楼的说明和2楼的介绍.采集红色框里面的内容!
    格式为(?<content>[\s\S]*?)
      

  5.   


    使用正则匹配内容时必须包含content组来识别内容,格式为(?<content>您的正则)谢谢 
      

  6.   

    红色部分一条正则比较难,多条或者可以,用xpath倒简单点