补充以下,这里用的是winform的程序,不是asp.net

解决方案 »

  1.   

    将HTML读进内存,然后可以能过IndexOf,SubString等函数来操作,不过前提是你要截取的HTML文本前后有明显的标记。
      

  2.   

    IndexOf,SubString,我最不想用的就是这种方法,有没有其他方法,比如对html的类什么的?
      

  3.   

    有一个思路不知道能不能行(没有试过)把html文本作为文件来读入,这样就有方法来对其中的tag进行定位,并提取tag之间的内容,但是问题是如何在多个tag相同的情况下,判断出哪一个是想要的。
    可以看一下下面这篇文章和demo,上面讲述了如何搜索网页重的key words,应该对你有用
    http://www.codeproject.com/aspnet/SearchDotnet.asp
      

  4.   

    ............................看了半天,结果是winform的,白回答了
      

  5.   

    提取<td></td>中的内容(把<td>和</td>都转程ascii码)StreamReader sr = new StreamReader("xxx.htm", Encoding.GetEncoding("gb2312"));
    string MatchingScript = rs.ReadLine();
    RegStr="\x3c\x74\x64\x3e(.*|\n)\x3c\x2f\x74\x64\x3e";
    reg = new Regex(RegStr, RegexOptions.Singleline);
    Match m = reg.Match(MatchingScript);
    string target = m.Groups[1].Value;