请教nutch中的crawl的配置!!

看了很多网上的东西安装nutch后发现都不行..
首先
配置好crawl后
1.配置 crawl-urlfilter.txt 里面的网站
+^http://([a-z0-9]*\.)*163.com/ (匹配所有网页)
2.创建urls目录
urls/url.txt 内容为 http://www.163.com就可以爬了... 但是怎么样进行多个网站的匹配呢??
我试过
urls/url.txt 内容为
http://www.163.com
http://www.baidu.com
http://www.其他...comcrawl-urlfilter.txt里面
+^http://([a-z0-9]*\.)*163.com/ (匹配所有网页)
+^http://([a-z0-9]*\.)*baidu.com/ (匹配所有网页)
+^http://([a-z0-9]*\.)*其他.com/ (匹配所有网页)
结果不行..只有163是可以的..而且我要是想指定一个路径开始呢??也无法爬得下来..如
http://www.163.com/news/201010/所有的网页
怎么样配置呢??

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

你应该在你的url.txt文件中也配置其他的网址，和crawl-urlfilter.txt里面的一直，就可以了