Perl等语言似乎都可以找到类似的类库。就是定义一个模板(或者说规则)。送入一个网页可以得到根据模板得出的结果。类似政则。但是是针对网页的。可以处理相对复杂的页面。比如网页中表格的交替色什么的
scraper例子。我送如一个模板。和一段Html
模板如下
<html1>
数据1
<html2>
数据2
<html3>
数据3
<html4>Html文件如下<html1>
123
<html2>
333
<html3>
1111
<html4>
<html1>
444
<html2>
555
<html3>
666
<html4>得到结果
数据1  数据2 数据3
123   333    1111
444   555    666当然这个是最简单的例子。
如果网页复杂一点应该如何处理?有没有现成的类?