either use regular expressions to retrieve the information or look into
SGMLReader
http://www.xmlforasp.net/codeSection.aspx?csID=94HTML to XHTML Conversion with SGMLReader
http://www.eggheadcafe.com/articles/20030317.aspAn Elementary HTML Parser
http://www.codeproject.com/csharp/HTMLParser.asp

解决方案 »

  1.   

    you can download the code at
    GotDotNet User Sample: SgmlReader 1.31 
    http://www.gotdotnet.com/Community/UserSamples/Details.aspx?SampleGuid=B90FDDCE-E60D-43F8-A5C4-C3BD760564BC
      

  2.   

    我在写ASP的时候,是先分析一下那个HTML的文件结构,然后再用正则或是字符串分割把要的东西取出来。
      

  3.   

    要看网页的格式是否是固定的。如果是固定的,那就好办了。如果不是,我认为,首先应该析取html文件中的所有文字信息,然后进行内容提取。
      

  4.   

    flowerer所言极是,问题有关键就是如何处理网页格式的动态变化!
    有没有什么高招?
      

  5.   

    都是使用WEBREQUEST和WEBRESPONSE来获取HTML流然后用正则表达式去解析的呢
    看看这个
    http://www.csdn.net/develop/Read_Article.asp?Id=23731
    具体根据自己的实际情况修改