抓取网页中a标签href连接内容和a标签内的内容 分别插入到数据库表字段中href的连接必须是网址
解决方案 »
- 如何在网页上播放视频
- asp.net 怎样弹出“操作成功”后再转向其它界面
- 请问大家设计aspx页面,都用什么工具呀?
- web应用 DXpereince 9.1 如何汉化???
- 如何重写之前注册的客户端脚本
- .net Session
- 在asp.net中该使用static变量吗?欢迎讨论
- ASP.NET验证控件是否会在服务器端做检查呢。
- 《asp.net 入门经典 c#编程篇》是beta2版的,影响我的学习不
- asp.net 当用户在网页下订单以后,服务器端如何自动将用户订单打印出来。
- ASP.NET建的网站怎么在局域网内访问?
- C# VS2008中发布webservice到本机iis的时候是不是自动预编译了?
/// <summary>
/// 通过节点名称以及节点的一个属性值在源码中过滤出相应的信息
/// </summary>
/// <param name="type"></param>
/// <param name="attribute"></param>
/// <param name="attributeName"></param>
/// <param name="paser"></param>
/// <returns></returns>
public NodeList getNodeListByAttribute(string nodeName, string attributeName, string attributeValue, Parser paser)
{
NodeList nodeList = null;
try
{
NodeFilter nodeFilter = new TagNameFilter(nodeName);
NodeFilter nameFilter = new HasAttributeFilter(attributeName, attributeValue);
AndFilter andFilter = new AndFilter(nodeFilter, nameFilter);
nodeList = paser.ExtractAllNodesThatMatch(andFilter);
}
catch (Exception ex)
{
MessageBox.Show(ex.Message);
}
return nodeList;
}NodeList nodeList = getNodeListByAttribute("a", "属性", "属性值", Parser.CreateParser(html, "utf-8"));
using Winista.Text.HtmlParser;
using Winista.Text.HtmlParser.Filters;
using Winista.Text.HtmlParser.Util;引入这个Winista.HtmlParser.dll
string html = string.Empty;
using (StreamReader reader = new StreamReader("html路径或链接", Encoding.GetEncoding("utf-8")))
{
html = reader.ReadToEnd();
reader.Close();
}
百度:C# 爬虫
1、WebClient读取html
2、使用正则表达式过滤
3、存储