用纯C语言写了一个HtmlParse(网页分析器)外带采集功能,大小只有200K(免费+开源+操作示意图) 下载地址: http://tieba.cangzhuo.com/tieba-%25B2%25D8%25D7%25BE-kz-ff11da70f37b11dd8000354100003541.html 用法很简单,比如:你把网页分析器保存到D:\那你直接在 dos 窗口下输入: 
d:\czhtmlparse "http://tieba.cangzhuo.com/" 
然后回车就可以了! 
运行需要一个参数, 
第一个参数 
"http://tieba.cangzhuo.com/" 
表示要下载的地址 目前测试过的大型网站有 
http://www.csdn.net/ 
http://www.google.cn/ 目前支持 GB2312编码、UTF-8编码自动转换、ISO-8859-1 及无编码类型网页! 
下一版本将增加对BIG5编码类型网页的转换支持! 更多详情请关注: http://tieba.cangzhuo.com/tieba-%25B2%25D8%25D7%25BE.html

解决方案 »

  1.   

    HtmlParser 网页采集分析器已经升级更新已经增加对UTF-8中文繁体、GBK中文繁体、BIG5中文繁体 转换成BG2312的功能! 
    另外增加了对宽字符的支持!另补充说明:未使用任何第三方类库和正则库,完全自己编码实现!欢迎大家批评指正!多提宝贵意见!谢谢!
      

  2.   

    这种就是广告贴,楼上几位还真当真了
    他这种软件发错地方了,也不看看这是什么版块,直接KILL掉他