目的为了采集页面内的指定连接地址,HMLT问价处理后结果如下:<td class="icn">
<a href="thread-872512-1-2.html" onclick="atarget(this)" class="xst" >xxx</a>
</td>
<td class="icn">
<a href="thread-872512-2-2.html" onclick="atarget(this)" class="xst" >xxx</a>
</td>
<td class="icn">
<a href="thread-872512-3-2.html" onclick="atarget(this)" class="xst" >xxx</a>
</td>
<td class="icn">
<a href="thread-872512-3-2.html" onclick="atarget(this)" class="xst" >xxx</a>
</td>
<td class="icn">
<a href="thread-872512-4-2.html" onclick="atarget(this)" class="xst" >xxx</a>
</td>如上一段HTML,需要截取上面的连接地址,如:“thread-872512-4-2.html”
使用TRegExpr组件
目前代码:
myExpr.Expression :='<a href="(.*?)" onclick="atarget\(this\)" class="xst" >';
if myExpr.Exec(htmlStr) then
repeat
url := myExpr.Match[0];
urlList.Add(url);
until not MyExpr.ExecNext;
finally
myExpr.Free;求解!!!
<a href="thread-872512-1-2.html" onclick="atarget(this)" class="xst" >xxx</a>
</td>
<td class="icn">
<a href="thread-872512-2-2.html" onclick="atarget(this)" class="xst" >xxx</a>
</td>
<td class="icn">
<a href="thread-872512-3-2.html" onclick="atarget(this)" class="xst" >xxx</a>
</td>
<td class="icn">
<a href="thread-872512-3-2.html" onclick="atarget(this)" class="xst" >xxx</a>
</td>
<td class="icn">
<a href="thread-872512-4-2.html" onclick="atarget(this)" class="xst" >xxx</a>
</td>如上一段HTML,需要截取上面的连接地址,如:“thread-872512-4-2.html”
使用TRegExpr组件
目前代码:
myExpr.Expression :='<a href="(.*?)" onclick="atarget\(this\)" class="xst" >';
if myExpr.Exec(htmlStr) then
repeat
url := myExpr.Match[0];
urlList.Add(url);
until not MyExpr.ExecNext;
finally
myExpr.Free;求解!!!
解决方案 »
免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货