大家好,我是一名大四的学生,我最近在准备毕业论文(题目是:基于web的数据挖掘),我打算用java写一个可以从网页中抽取信息的工具,现在我用jtidy写了一个把html转化为xml的程序,后面不知道怎么抽取信息,对xsl也不是很懂。我就读一所财经院校,到现在为止也没有办法找到一个在java或者web挖掘方面给我指导的老师,自己也只有一些java的基础,现在感觉力不从心。所以希望在这方面有研究的大哥哥大姐姐们给我一些指导。在此先谢过了!
解决方案 »
- JBPM4.3中org.hibernate.exception.SQLGrammarException: could not execute query
- ssh整合问题
- 框架
- 求教各位:servlet-api.jar ...... jar not loaded......
- 请教J2EE制作的网站线程数大量增加的问题
- 有项目经验的高手请进来:问Jsp虚拟空间的问题。
- 设置applet
- 请教如何通过smtp服务器的验证???
- 请问我写了一个ejb和相应接口要放在什么目录下,客户端才能找到?
- idea中读取properties文件有些可以正确读取,有些无法读取
- 如何将xml转换成excel
- Html Parser如何抽取信息
直接用HTMLPARSER解析HTML也可以.