请教
一般是需要浏览器打开,然后另存为txt文件,
如何不需要浏览器打开,就可以直接另存为txt文件

解决方案 »

  1.   

    找个爬虫程序把html代码存入txt中去
      

  2.   

    从一个网页入口,分析链接,一层一层的遍历,或者从一组网页入口,或者从一个rss源列表开始爬rss;  
    获取每个页面的源码保存在磁盘或者数据库里;  
    遍历抓下来的网页进行处理,比如提取正文,消重等;  
    根据用途把处理后的文本进行索引、分类、聚类等操作
    参考
    爬虫
      

  3.   

    写个小程序,功能是修改文件的扩展名就可以。
    欢迎光临  我的博客 http://www.zlblogs.com