HTML代码怎么分析?
怎么按标签来将数据存入树里?

解决方案 »

  1.   

    HTML代码怎么分析?
    怎么按标签来将数据存入树里?
    LZ是什么意思?
      

  2.   


        很麻烦的,而且如果HTML不规范,那么>>>>>>>>>
      

  3.   


            public static string jobyear(string html)
            {
                string pname = "工作年限:</td><td valign=\"top\">(?<jobyear>\\w*)</td>";
                re = new Regex(pname);
                ma = re.Match(html);
                return ma.Groups["jobyear"].Value;
                
            } 
      

  4.   

    不能用正则,随意给的一个HTML。对HTML进行切片,分析权重。
      

  5.   

    他是要用来seo的。大家别误会。。提问的时候一定要吧问题说清楚。否者别人无法理解
      

  6.   

    不懂楼主啥意思。HTML代码N多,你要分析哪块?你要按什么标签将什么数据插入树里?
      

  7.   

    比如。
    一个站有
    导航区域,公告区域,内容区域,页尾
    程序自动分析HTML把这几个区域提取出按一个算法来计算他们的权重。那个区域是这个网页的主要内容。
      

  8.   

    最佳参考,HtmlParser入门指南
    http://www.netomatix.com/Products/DocumentManagement/HTMLParserNet.aspx小型项目采用SgmlReader
    当然也少不了Simon Mourier的.NET Html Agility Pack
      

  9.   

    HtmlAgilityPack
    可以把html解析成dom树;
    支持不规范的html.