是否一个个人网页就是一篇文献?其中meta有描述关键字?
如果没有其他的索引工具,你可以使用URL/URLConnection把页面内容提取,自行分析页面中的meta数据。

解决方案 »

  1.   

    呵呵,要是XML的文档就很好办了!!!
      

  2.   

    这就是著名的网页爬虫软件了,记得看过一本关于网页爬虫的书的,你可以去找找看,机械工业出版社的,讲的不错XML的出现就可以很好的解决你说的这样的问题,不过要求他的网站用XML来写,呵呵
    现在是达不到拉。你说的这样的应用在目前的HTML体系里面比较难以做到啊。即使利用最优秀的搜索引擎照样会搜索出垃圾,所以想完全达到你的要求比较困难。