我使用了VPN网络连接,Heritrix抓不下来网页,但是自己写Java连接网络是能获得网页内容的,用浏览器也能打开。 如果关掉VPN,就能抓取到网页内容了。 我想是不是Heritrix连接网络有什么限制。 翻了源代码,想找heritrix在执行过程中访问网络的过程,可是heritrix内部实现很复杂,没有找到 谁知道原因啊,或者告诉我heritrix执行任务过程从哪里开始访问网路的 我用的Heritrix版本是 1.14.3 谢谢。