有个抓页面的程序,用了很久了一直没问题.就是根据给它的url来建立URLConnection,然后getInputStream. 如果这个url是xxxxxx.jsp那么抓到的内容应该是jsp解析以后生成的HTML代码。
但是前几天重新配置了一台服务器,在心服务器上用这个程序的时候抓xxxx.jsp返回的却是这个被抓的jsp的源代码。
请问有人遇到过这种现象么?服务器是用的Apache+tomcat,Linux。
谢谢!
但是前几天重新配置了一台服务器,在心服务器上用这个程序的时候抓xxxx.jsp返回的却是这个被抓的jsp的源代码。
请问有人遇到过这种现象么?服务器是用的Apache+tomcat,Linux。
谢谢!
?
源代码?你直接访问xxx.jsp浏览器是返回html还是jsp?
-------------------------------------------------
直接访问xxx.jsp是html,很正常。
但是用抓的就返回jsp源代码。
?
有次我没配置对服务器也把config.php给down了下来...
------------------------------------------------
哪里没有配置对?
个人觉得应该不会,除非你抓取得网站没有配置正确。
http://haolla.com/wy
? 你在抓本机时也用公网IP试试,不要用127.0.0.1
---------------------------------------------------
这个不行,因为服务器是在apache后面的。apache装在负责接收公网请求的交换机上。对于服务器来说,公网ip它是找不到的。
==========
不会吧????公网IP找不到????那能不能找到163,SINA,CHINAREN呢,
我的意思是说不要直接抓本机,而是通过外网转个圈回来抓,就像你抓别的网站一样
所以说要绕过本地才行
----------------------------------------------------用右键,查看源文件不行吗?
是不是应该把服务器配置一下,让它访问127.0.0.1的时候也通过http而不是直接在本机访问文件?