怎样从html文本中提取关于表单的关键信息及元素,比如
<meta http-equiv="Content-Type" content="text/html; charset=gb2312"><form METHOD="post" ACTION="/join.htm" name="form" onsubmit="return submitForm(this);">
<input name="_fmm.j._0.fi"  type="text" value="">
<input name="_fmm.j._0.p" value="86">
用正则表达式还是怎么弄?

解决方案 »

  1.   

    但是我对正则不是很熟,你说浏览器都是怎么解读html和定位html元素的呢,也是用正则吗,他们用什么正则?
    举例上面的第一行,如果用boost,该怎么查找呢?
      

  2.   

    取决于你想使用DOM还是直接解析字符串,目的是为了干什么?
      

  3.   

    不会正则的话 用string 的find咯 
      

  4.   

    想填表单就得使用DOM,正则解析字符串是毫无用处的。加载一个浏览器控件来打开页面,然后在DOM里导航,能做任何事情。
      

  5.   

    用什么DOM,怎么用,为什么我搜不到?
      

  6.   

    HTML的每个标签都被解析成DOM中的一个元素节点,节点之间有父子兄弟关系,能导航,能用脚本控制文档内容,能响应节点的各种用户事件,当然也能执行form提交。
      

  7.   

    如果我搜索,应该怎么搜,查找Html DOM找不到想要的,哪里有材料可以参考?
      

  8.   

    从IWebBrowser2或者IHTMLDocument2开始搜