基本上前提是已经利用WebBrowser创建了一个基本的Web浏览器,然后就是
Private Sub Text1_Click()
    Text1 = WebBrowser1.Document.body.innerHtml
End Sub但问题是TextBox内显示是有字符限制的,我在网上搜索到的其它方法是将Text1的内容直接保存为*.txt文件,然后再用正则提取*.txt内所需要的内容,请问是否还有其它的解决办法!

解决方案 »

  1.   

    textbox好像是64K限制,对于可以正常浏览的网页来说,怎么都够了吧:P
      

  2.   

    我试过有些页面能够完全显示其Html的代码(例如www.baidu.com),有些则不能完全显示,当我将WebBrowser1.Document.body.innerHtml 改为WebBrowser1.Document.body.innerText的时候则可以完全显示纯文字内容,这说明如果要显示包括Html标记在内的所有内容,就有可能超出限制——好象是这样!请问二楼的有什么好方法吗?
      

  3.   

    没用WEB来获取源代码过
    如果条件允许,还是用inet来获取吧
    速度来得更快,因为是直接获取源代码,不像WEB要先打开页面
      

  4.   

    同步方式 
    htmlstr=inet1.openurl(strurl,icstring)如果需要POST什么的,就用异步方式,上网查查,代码太复杂,我不想写...
      

  5.   

    找了一个代码
    Private Sub Command1_Click()
        Dim strURL As String, strFormData As String
        strURL = "http://www.mzwu.com/re.asp"
        strFormData = "username=dnawo&userpass=123456"
        Inet1.Execute strURL, "POST", strFormData, "Content-Type: application/x-www-form-urlencoded"
    End Sub
    Private Sub Inet1_StateChanged(ByVal State As Integer)
        If State = 12 Then Text1.Text = Inet1.GetChunk(1024, icString)
    End Sub不过获取源码的代码有问题,只能获取一块的内容,可以这样
    Private Sub Inet1_StateChanged(ByVal State As Integer)
      if state=12 then
        sTmp   =   INET1.GetChunk(1024,   icString) 
            If   Len(sTmp)   =   0   Then 
                    bDone   =   True 
            End   If 
            Do   While   Not   bDone 
                    Get_Data   =   Get_Data   +   sTmp 
                    sTmp   =   INET1.GetChunk(1024,   icString) 
                    If   Len(sTmp)   =   0   Then 
                            bDone   =   True 
                    End   If 
            Loop
         '最后 get_data就是整个页面的源码,不过此代码对中文字支持不太好,我以前写的时候出现过部分字符乱码的问题,我估计是分包时把双字节汉字给分割了,后来采用二进制获取就好了:) 
       end if
    End Sub
      

  6.   

    有哪位大虾再指点WebBrowser1.Document.body.innerHtml 接下来的思路啊!!!先谢谢啦~~
      

  7.   

    不好意思,现在正在学习WebBrowser中,兄台提供的源码暂时还没有去试过。这并非漠视你的劳动成果~~~
      

  8.   

    问题意外解决,心情大好~~~散分ing