现在我要研究的是nutch的分层抓取和索引 
nutch默认的也是分层抓取,但是索引是最后做的。我希望是抓取一层,接着就做索引,然后抓取第二层,在做索引,然后把第一层的索引和第二层的索引合并起来,请问这样能实现吗? 就是把invert()、index()、dedup()、merge()拿到for循环里面去。
而不是做完,生成/抓取/更新 循环,再做invert()、index()、dedup()、merge()这些操作;请指教一下!
先谢谢了!