这是两个问题,第一:如何获取网页中的纯文本。 这个网页文件是本地的。文件路径由变量+固定值组成。如:C:/1/"变量1"/"变量2"/1.htm取得后要另存为TXT格式,最好能保持网页中格式。如:
1111:你好
2222:好11111
1111:哈哈
2222:嘿嘿第二: 比较两个不同TXT中不同的内容,并且可以过滤掉特定的内容。 同样文件路径也是有变量的。最好是逐行比较,但速度要快点的,因为此操作比较频繁。比较后的文件放在另一个TXT中。如:txt1内容如下
--------------------------
1111:你好
2222:好11111
1111:哈哈
2222:嘿嘿
--------------------------
txt2内容如下: 1111:你好
2222:好11111
1111:哈哈
2222:嘿嘿
1111:你谁
2222:你笨蛋---------------------------
过滤条件:笨蛋 (不包含)
-------------------------- 输出的txt3为:
1111:你好
2222:好11111
1111:哈哈
2222:嘿嘿
---------------------------
看起来很复杂,谢谢大家了
1111:你好
2222:好11111
1111:哈哈
2222:嘿嘿第二: 比较两个不同TXT中不同的内容,并且可以过滤掉特定的内容。 同样文件路径也是有变量的。最好是逐行比较,但速度要快点的,因为此操作比较频繁。比较后的文件放在另一个TXT中。如:txt1内容如下
--------------------------
1111:你好
2222:好11111
1111:哈哈
2222:嘿嘿
--------------------------
txt2内容如下: 1111:你好
2222:好11111
1111:哈哈
2222:嘿嘿
1111:你谁
2222:你笨蛋---------------------------
过滤条件:笨蛋 (不包含)
-------------------------- 输出的txt3为:
1111:你好
2222:好11111
1111:哈哈
2222:嘿嘿
---------------------------
看起来很复杂,谢谢大家了
1.两种办法:使用正则表达式取出文本内容
2.使用Web browser打开以后访问 Body对像的InnerText属性第二个问题:
将两个文本文件装载到Dictionary(集合)对像中,依次比较即可
Text1 用來输入要取取的网页位址,例如:http://www.microsoft.com/taiwan/support/products/vb.htm
Text2 用來输入要存文件的完整文件名,例如:c:\temp\temp.htm VB code
Private Sub Command1_Click()
Dim b() As Byte
'取消所有操作
Inet1.Cancel
'设定协议为 HTTP
Inet1.Protocol = icHTTP
'设定 URL 属性
Inet1.URL = Text1.Text
'将读取的 HTML 数据放进一个 byte array.
b() = Inet1.OpenURL(, icByteArray)
'建立一个暂存文件來存放取回來的 html 文件
Open Text2.text For Binary Access Write As #1
Put #1, , b()
Close #1
End Sub