最近做一个项目,需要抓取网站数据.
其实我到现在还不是很明白抓取网站数据到底是想要做什么?
抓取网站数据貌似也只能抓取到网页的HTML代码吧.
获取整个网页的HTML我已经能取到了.
就是想通过解析获得网页中<body>.....</body>的数据,求大虾赐教.
其实我到现在还不是很明白抓取网站数据到底是想要做什么?
抓取网站数据貌似也只能抓取到网页的HTML代码吧.
获取整个网页的HTML我已经能取到了.
就是想通过解析获得网页中<body>.....</body>的数据,求大虾赐教.
"<body>([^<]*)</body>"
(?is)<body\b[^>]*>(.+?)</body>
<tr>
<tr>
<td>
</td>
</tr>
<tr>
<td>
</td>
</tr>
</tr>
string result=reg.Match("网页代码").Groups["body"].Value;
string body = m.Groups["out"].Value;
(?is)<tr[^>]*>((?<o><tr)|(?<-o></tr)|((?!</?tr).)+)+(?(o)(?!))</tr>