HTML分析, HTML代码怎么分析?怎么按标签来将数据存入树里? 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 HTML代码怎么分析?怎么按标签来将数据存入树里?LZ是什么意思? 很麻烦的,而且如果HTML不规范,那么>>>>>>>>> public static string jobyear(string html) { string pname = "工作年限:</td><td valign=\"top\">(?<jobyear>\\w*)</td>"; re = new Regex(pname); ma = re.Match(html); return ma.Groups["jobyear"].Value; } 不能用正则,随意给的一个HTML。对HTML进行切片,分析权重。 他是要用来seo的。大家别误会。。提问的时候一定要吧问题说清楚。否者别人无法理解 不懂楼主啥意思。HTML代码N多,你要分析哪块?你要按什么标签将什么数据插入树里? 比如。一个站有导航区域,公告区域,内容区域,页尾程序自动分析HTML把这几个区域提取出按一个算法来计算他们的权重。那个区域是这个网页的主要内容。 最佳参考,HtmlParser入门指南http://www.netomatix.com/Products/DocumentManagement/HTMLParserNet.aspx小型项目采用SgmlReader当然也少不了Simon Mourier的.NET Html Agility Pack HtmlAgilityPack可以把html解析成dom树;支持不规范的html. 如何求数据波动区间的持续时间范围,有没有更好的方法? 问一个c#Form的鼠标事件问题 打印的内存错误 如何用C#获取本机CPU的信息 急~~~~~请问如何实现两个listview间的内容复制? c#字符串的格式 CS0246: 找不到类型或命名空间名称“ValidateCode”(是否缺少 using 指令或程序集引用?) sql2000中WINDOWS登陆代码? 怎样实现多个参数(多态?),比如一个函数调用的时候可以写一个,也可以写两个参数 如何才能让文本框变成透明的? 退出窗口之前,询问对方是否保存?怎么实现的? 怎样传递参数给正在运行的winfrom 程序?
怎么按标签来将数据存入树里?
LZ是什么意思?
很麻烦的,而且如果HTML不规范,那么>>>>>>>>>
public static string jobyear(string html)
{
string pname = "工作年限:</td><td valign=\"top\">(?<jobyear>\\w*)</td>";
re = new Regex(pname);
ma = re.Match(html);
return ma.Groups["jobyear"].Value;
}
一个站有
导航区域,公告区域,内容区域,页尾
程序自动分析HTML把这几个区域提取出按一个算法来计算他们的权重。那个区域是这个网页的主要内容。
http://www.netomatix.com/Products/DocumentManagement/HTMLParserNet.aspx小型项目采用SgmlReader
当然也少不了Simon Mourier的.NET Html Agility Pack
可以把html解析成dom树;
支持不规范的html.