Perl等语言似乎都可以找到类似的类库。就是定义一个模板(或者说规则)。送入一个网页可以得到根据模板得出的结果。类似政则。但是是针对网页的。可以处理相对复杂的页面。比如网页中表格的交替色什么的
scraper例子。我送如一个模板。和一段Html
模板如下
<html1>
数据1
<html2>
数据2
<html3>
数据3
<html4>Html文件如下<html1>
123
<html2>
333
<html3>
1111
<html4>
<html1>
444
<html2>
555
<html3>
666
<html4>得到结果
数据1 数据2 数据3
123 333 1111
444 555 666当然这个是最简单的例子。
如果网页复杂一点应该如何处理?有没有现成的类?
scraper例子。我送如一个模板。和一段Html
模板如下
<html1>
数据1
<html2>
数据2
<html3>
数据3
<html4>Html文件如下<html1>
123
<html2>
333
<html3>
1111
<html4>
<html1>
444
<html2>
555
<html3>
666
<html4>得到结果
数据1 数据2 数据3
123 333 1111
444 555 666当然这个是最简单的例子。
如果网页复杂一点应该如何处理?有没有现成的类?
解决方案 »
- 关于entity framewrok
- 求在VB6中制作标准DLL的步骤方法。我想在VB6中将一些现有的函数制作成DLL,然后在C#中调用这个DLL中的函数。
- 想做一个BBS,但为什么总是提醒说无法找到目录
- 请问,asp.net里的那个图片滚动框是怎么作成的呀?
- 求助!~!~
- 请各位大虾帮忙(如何去除图片背景)
- RemotingServices.RegisterWellKnownType
- 使用OleDbDataAdapter读取excel文件的问题
- 紧急gbk转换
- 在DataSet找到满足条件的记录进行更新。或删除。
- 寻搜索技术高手,请跟贴报名,附上你在此技术上的说明
- 问一个关于tabControl的问题
http://search.cpan.org/perldoc?Template%3A%3AExtract
http://search.cpan.org/perldoc?WWW%3A%3AScraper楼上的.你的是什么意思?我不是想吧Ds转到XML.是类似与想吧Html转到XML.以上是Perl的模块举例.
就是找一个可以采集Web数据的方法.通用一点的...^_^..