htmlparser解析html文档 我看到了一篇论文利用关于提取网页主题信息的。里面说的了利用htmlparser解析html文档生成DOM树,我不理解是怎么个生成法?请问有没有人能帮我解答一下疑惑。 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 html其实就是标记性语言,跟xml一样,当读取时将整个根叶元素读入到内存,然后进行增删改查。 同意一楼。就是解析xml,根据不同的标签获取相应的数据。 建议楼主去学习一下dom的知识 就明白了 加油 是不是我没说清楚呢,xml解析的到dom树我能知道怎么做,因为有确定的格式,但是我现在爬虫得到的网页代码没有确定的格式的,我怎么能和解析xml一样的去得到网页的html文档的dom树结构呢? 基础题(小程序) 图片的显示 怎么将页面上的数据转换到数据库中 mysql、jdbc问题,请大家不吝赐教 动态添加数据问题 求助:关于鼠标事件的问题? 如何中止线程?? 问个困饶我一身地问题! 超级新手问题,java的程序用什么来编写呢? 關於通過JFileChooser在遠端服務器選擇本地文件夾的問題 JAVA下拉框 Java JPanel 问题(急!!!)
是不是我没说清楚呢,xml解析的到dom树我能知道怎么做,因为有确定的格式,但是我现在爬虫得到的网页代码没有确定的格式的,我怎么能和解析xml一样的去得到网页的html文档的dom树结构呢?