大家好!
最近做东西需要过滤掉HTML文档中的标签,目前还没有想到比较好的解决方法.我也注意到SF上有个HTMLParser下载下来后发现还是个相当大的项目,并且据说解析效果并不好.于是想自己想个解决方案,各位能不能给点意见? 提前谢过了!
最近做东西需要过滤掉HTML文档中的标签,目前还没有想到比较好的解决方法.我也注意到SF上有个HTMLParser下载下来后发现还是个相当大的项目,并且据说解析效果并不好.于是想自己想个解决方案,各位能不能给点意见? 提前谢过了!
解决方案 »
- CList Ctrl控件真是个麻烦的东东
- AfxBeginThread函数创建的线程怎么关闭
- webbrowser怎样设置,才能使打开的新链接都用新窗口打开呢?
- 怎么从HBITMAP句柄中获得想要的象素数据??
- 紧急求助,在CMyApp::InitInstance()中需要引用CMyView()中各一个public变量,提示错误?
- 请教高手,关于ANSI和Unicode的问题
- 急!急!急!*高手请进!*
- 继续FTP服务测试,不限速,不限线程,越多越好,欢迎上传...
- 问个问题?
- CEdit::GetLine(...) 为什么不能读取一行??
- 按钮回车问题?
- 又是一个线程函数参数传递问题,请大家帮帮忙。
2、要解析HTML代码(字符串),简单的用正则表达式可以做。
我用正则表达式写过简单的HTML解析组件,但是对于复杂的HTML效果不好,复杂的可能要用到词法分析,解释器之类的了。