目的为了采集页面内的指定连接地址,HMLT问价处理后结果如下:<td class="icn">
 <a href="thread-872512-1-2.html" onclick="atarget(this)" class="xst" >xxx</a>
</td>
<td class="icn">
 <a href="thread-872512-2-2.html" onclick="atarget(this)" class="xst" >xxx</a>
</td>
<td class="icn">
 <a href="thread-872512-3-2.html" onclick="atarget(this)" class="xst" >xxx</a>
</td>
<td class="icn">
 <a href="thread-872512-3-2.html" onclick="atarget(this)" class="xst" >xxx</a>
</td>
<td class="icn">
 <a href="thread-872512-4-2.html" onclick="atarget(this)" class="xst" >xxx</a>
</td>如上一段HTML,需要截取上面的连接地址,如:“thread-872512-4-2.html”
使用TRegExpr组件
目前代码:
      myExpr.Expression :='<a href="(.*?)" onclick="atarget\(this\)" class="xst" >';
      if myExpr.Exec(htmlStr) then
      repeat
      url :=    myExpr.Match[0];
      urlList.Add(url);
      until not MyExpr.ExecNext;
      finally
      myExpr.Free;求解!!!