大家好,我是一名大四的学生,我最近在准备毕业论文(题目是:基于web的数据挖掘),我打算用java写一个可以从网页中抽取信息的工具,现在我用jtidy写了一个把html转化为xml的程序,后面不知道怎么抽取信息,对xsl也不是很懂。我就读一所财经院校,到现在为止也没有办法找到一个在java或者web挖掘方面给我指导的老师,自己也只有一些java的基础,现在感觉力不从心。所以希望在这方面有研究的大哥哥大姐姐们给我一些指导。在此先谢过了!