C#已经读取到HTML页面的源代码了,
要修改源代码中的<div id="content"></div>(或<div id="divMain"></div>)中的内容,
修改方式好像有两种方式:
1、使用webbrowser控件 获取DIV内容
Document.Body.All["photo_view_url"].GetAttribute("value")2、使用c#正则获取(但不会写正则,需要匹配<div id="content">(或<div id="divMain">)再获取该层的内容。然后获取后修改完成了,怎么保持回到源文件中。请高手指教!

解决方案 »

  1.   

    (?<=<div id=\\"content\\">).*?(?=</div id=\\"content\\">)
    那个双引号的转义根据实际情况修改
      

  2.   

    Regex reg= new Regex(@"(?is)<DIV\s+id=""content"">(?><div[^>]*>(?<o>)|</div>(?<-o>)|(?:(?!</?div\b).)*)*(?(o)(?!))</div>");
    Match m = reg.Match("");
    if (m.Success)
    {
       TextBox1.Text = m.Value;
    }
      

  3.   

    用第一种方法很简单了。
    string div_html = webBrowser1.Document.Body.All["photo_view_url"].InnerHtml
    设置也是这样
    //div_html修改
    webBrowser1.Document.Body.All["photo_view_url"].InnerHtml = div_html;