我使用了VPN网络连接,Heritrix抓不下来网页,但是自己写Java连接网络是能获得网页内容的,用浏览器也能打开。 如果关掉VPN,就能抓取到网页内容了。 我想是不是Heritrix连接网络有什么限制。 翻了源代码,想找heritrix在执行过程中访问网络的过程,可是heritrix内部实现很复杂,没有找到 谁知道原因啊,或者告诉我heritrix执行任务过程从哪里开始访问网路的 我用的Heritrix版本是 1.14.3 谢谢。
解决方案 »
- 页面显示正常,后台却输出Servlet.service() for servlet [jsp] in context with path [/luntan] t
- struts2 中Action 怎么安条件查询怎么安条件查询
- 急呀,我用eclipse开发第一个servlet出现了问题,搞了好久都不行
- eclipse3.5中Maven工程不能发布jar包
- 关于字符串分割截取的问题 难度★★★
- 高分求解——习方法的问题——如何学习源代码?
- [求救]为什么同样的程序在Jcreator中能运行,而在Eclipse中却报错?
- socket通信的图形界面程序怎么做?
- 请问怎样能在Java Application中的得到键盘的值
- 像tomcat-users那样的配置,注册一个新的USER,将该USER的信息保存到XML文件里,该怎么做?
- apache与tomcat使用
- 【 功能已实现】java实现手机发送信息
<integer name="timeout-seconds">0</integer>
<integer name="sotimeout-ms">0</integer>
0 表示不限制时间