比如一份HTML的简历 ,我怎样才能获得里面如姓名,年龄 之类的自己想要的数据呢? 用普通C#程序实现,  谢谢高手了~~~我会兑现的  ~~

解决方案 »

  1.   

    document.getElementById("id").innerHtml;
      

  2.   

    html 源文件? 那还是文本处理 ...分析格式,特征信息 ...然后,想办法通过特征信息,解析之常见方法是,正则表达式匹配
      

  3.   

    采集网站 过滤掉所有HTML元素
      

  4.   

    HttpRequest or WebClient + Regex
      

  5.   

    System.Text.RegularExpressions.Regex.Replace(textBox1.Text, "<[^>]+>", "");去掉HTML标记
      

  6.   

    这个HTML的简历是远程的还是本地的,网页源文件是否已获得未获得远程的一般用HttpWebRequest等取得,本地的就直接读取得到源文件后,一般来说就是用正则分析,不过这要根据实际内容,即源文件的格式或规律来分析
      

  7.   

    仔细查看多个 此类型的html页面的特征,采用一定的规则来分析这个文件,把文件当作string字符串来处理。必要时要使用正则表达式
      

  8.   

    得看你那个html的姓名,年龄之类的数据是放在table里面的td里面还是放在一个可唯一标示的标签里面,前者处理起来麻烦,可以考虑给所需要取值得td里面给个id,然后再用javascript取出来用document.getElementById("id");后者就直接用那句话就可以了。
      

  9.   

    直接使用JS,
    document.getElementById("id")
    例:id 是存放姓名的文本...
      

  10.   

    谢谢 各位的回复~简历的内容肯定是放在table 里的,而且是本地的, 哪位给我找段源码研究下(POP3的那个就不用了) 再次感谢
      

  11.   

    http://topic.csdn.net/t/20061212/20/5225944.html
      

  12.   

    HTTPWebRequest取得指定URL地址的HTML
    然后使用正则表达式分析
    可以参考C#的爬虫程序
    http://www.codeproject.com/cs/internet/davwebspider.asp