我知道一般网页在documentComplete后能通过browser.documenttext得到html
但在获取这个网页(http://stock.bbs.hexun.com/docidx1.aspx?bid=2)时得到的并不是完整html
请问怎样才能得到完整的html
--------------------------------------------------------
我获取到的html:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" >
<HTML>
<HEAD>
<meta name="GENERATOR" Content="Microsoft Visual Studio .NET 7.1">
<meta name="CODE_LANGUAGE" Content="C#">
<meta name="vs_defaultClientScript" content="JavaScript">
<meta name="vs_targetSchema" content="http://schemas.microsoft.com/intellisense/ie5">
<script language="javascript">
<!--
// 切换左导航的显示状态
function switchNavLeft(){
if(frameNav.style.display=="block"){
frameNav.style.display="none";
}
else{
frameNav.style.display="block";
}
}
//-->
</script>
</HEAD>
<script>
var src = 'articles.aspx?bid=2';
var hashStr = document.location.hash;
if(hashStr != '')
{
hashStr = hashStr.slice(1, hashStr.length);
hashStr = hashStr.replace("|","?");
src = hashStr;
}
document.writeln("<body scroll='no' topmargin='0' leftmargin='0' rightmargin='0' bottommargin='0'>");
document.writeln("<TABLE height='100%' cellSpacing='0' cellPadding='0' width='100%' border='0'><TR>");
document.writeln("<TD id='frameNav' vAlign='middle' noWrap align='center' style='DISPLAY:block'>");
document.writeln("<IFRAME style='WIDTH: 138px; HEIGHT: 100%' src='navleft.aspx' frameBorder='0' scrolling='yes'></IFRAME>");
document.writeln("</TD><TD style='WIDTH: 100%'>");
document.writeln("<IFRAME name='frameContent' style='WIDTH: 100%; HEIGHT: 100%' src='"+src+"' frameBorder=0></IFRAME>");
document.writeln("</TD></TR></TABLE>");
document.writeln("");
document.writeln("</body>");
</script>
</HTML>

解决方案 »

  1.   

    iframe中嵌入的是不同的文件,你要获取全部的话,可以将这个当前页中的iframe部分解析出来,src是关联子文件的路径,然后再继续扒下去。
      

  2.   

    我觉得既然能通过在IE里面查看源文件得到完整html,那也应该可以在webbrowser里获取到,而没有必要解析出关联子文件的路径继续往下扒下去,事实上要是直接获取http://stock.bbs.hexun.com/articles.aspx?bid=2得到的html也是一样的
      

  3.   

    我还以为是需要cookies之类或者验证码的东西才跑进来看看进入你知道他是一个框架那么它必定镶嵌了其他的网页,你可以通过iframe src找到他连接的文件,然后请求这些超连接不就行了??
    <script>
    var src = 'articles.aspx?bid=2';看到了没???你进入浏览器打开这个网址看看,我相信这个就是你要的源代码http://stock.bbs.hexun.com/articles.aspx?bid=2既然是网络获取相关,那么应该自己学会分析,因为这种小问题你是可以解决的,因为这个是html的简单东西
      

  4.   

    进入http://stock.bbs.hexun.com/docidx1.aspx?bid=2找到源代码:<IFRAME style='WIDTH: 138px; HEIGHT: 100%' src='navleft.aspx' frameBorder='0进入
    http://stock.bbs.hexun.com/navleft.aspx可以找到所有的连接,随便点击一个股市论坛栏目的个股论坛
    进入http://stock.bbs.hexun.com/docidx1.aspx?bid=2&stock=0然后可以查看源代码
    可以找到:articles.aspx?bid=2&stock=0注意后面的参数是一模一样的,只不过文件名不同进入http://stock.bbs.hexun.com/articles.aspx?bid=2&stock=0看看是不是最终需要的结果??