lucence和heritrix怎么整合和优化 我在本地配好了一个heritrix,建了一个job爬了一个网站的URL,生成一个mirror文件夹,里面是爬到的镜像文件。然后我写了个lucence的demo,把目标文件夹定为那个mirror文件夹,然后开始递归地建立索引。可是效率MS不怎么高,有的一个子文件夹就要5 6分钟,请问heritrix爬下来的文件是不是要经过某些处理才开始建立索引啊?我是初学者,如果大家觉得偶问的问题幼稚请不要拿转头拍我 呵呵 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 恩,heritrix是要优化和定制过的,具体的方法是重新一个方法,将抓取的网页按要求用正则表达式匹配好,然后再用lucence建立索引,那样效率就提高了 蒙了。求个类型转换的问题 请高手进来谈谈关于页面静态化技术,在线等待 。。。 Tab移动的问题 mysql数据库里的中文信息取到jsp页面显示为‘??’,怎么办? jsp中一个下拉框变化另一个下拉框也变化 数据库 问一个关于编写javabean的编译的时候的一个问题,不知该怎么调试,请帮忙 新手提问:Hashtable是做什么用的?基本用法都有哪些!谢了! 它的用法(System.in) ? jsp连接mysql出现问题!!!!!!!怎么办? 急!!!那里有Professional JSP 2ND Edition java 获取数据库列表 web程序中如何实现排他
解决方案 »
免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货