把文件后缀名改成txt 就可以了

解决方案 »

  1.   

    不是吧,我是想将整个的文件内容的的修改为文本文件,改扩展名后,文件的内容还是html标记的文本文件。
      

  2.   

    我想将下载的网页转换为文本文件放入数据库,只要其中的内容,对html的描述格式信息没有兴趣,而且html的文本不单纯的文本多占位置。
      

  3.   

    你可以用Regex来过滤掉所有<>之间的内容.不过这样出来的结果估计你也不会满意.
      

  4.   

    我想通过调用word的功能也可以实现此功能,不过不知道在.net中要调用word对象要引用哪个namespace,在msdn中也没知道,请指教。
      

  5.   

    WebRequest wreq=WebRequest.Create("你需要的URL"); 
    HttpWebResponse wresp=(HttpWebResponse)wreq.GetResponse();                      
    Stream s=wresp.GetResponseStream(); 
    StreamReader objReader = new StreamReader(s); 
    然后自己再去过滤其中的HTML标签
      

  6.   

    先用WebClient下载网页到string
    然后替换<p>,</p>,<p/>,<br>,<br/>为"\r\n"
    再用正则表达式替换掉其他所有<>和<>之间的内容
    最后反向转义,比如&lt;&gt;等等转换为原来的字符差不多了,反正是文本文件,其他信息本来就不可能保存下来
      

  7.   

    对不起,我是想能不能直接调用 ie 或 word 的这个功能。
      

  8.   

    谢谢大家,这个问题已经基本解决,解决的步骤如下:先将一个网页文件以文本的形式读入一个字符串中,然后处理,将其中的有用的消息的那部分的html块提取出来,保存到数据库中的各个字段中然后将字段的内容分别读出,写入文件中然后调用word的功能以web的方式读出这个临时文件
    一文本的方式另存为另一个临时的文本 文件,在再将文本文件的内容读入数据库中字段中这样便自动的根据网页文件生成数据库了。当然也可以一步实现而不用第一个数据库文件做中转了。       Dim wrd As Object
            Dim doc As Object
            Set wrd = CreateObject("Word.Application")
            wrd.Visible = False
        
            wrd.Documents.Open "c:\content.doc", , , , , , , , , wdOpenFormatWebPages
        
            Set doc = wrd.ActiveDocument
            doc.SaveAs FileName:="c:\content.txt", FileFormat:=wdFormatText
            doc.Close SaveChanges:=wdDoNotSaveChanges
        
        
            wrd.Quit
        
            Set wrd = Nothing