最近突然想到一个问题,怎么样通过程序来获取哪些网页被哪些蜘蛛来爬过?
不知道是否可以得到相应的信息?
不知道是否可以得到相应的信息?
解决方案 »
- 从1~31个数字当中随机抽出8位数字等于一个指定的数字
- 如何安装java
- 如何替换java exe的文件图标
- 这样写为什么就不能连接上数据库,是不是类之间的关系放的不对?
- (在线等待)急,明天要去面试了,不知道远程教育软件需要什么技术,求救,急
- client端写一个串,再读一个串。server端读一个串,再写一个串。这个功能应该怎样实现?
- 小弟想在linux下用java做一个单机版的信息管理系统,怎样入手比较好呢?
- java 文件乱码了,被notepad++打开了一下,下次打开就乱码了。
- 能否简要说明一下Hashtable类和它的getRules函数的作用及用法
- jbuilder入门女生散分求助,急啊!
- 新手提问:在Java中如何选择已经保存的Config(配置)文件并显示出来?谢谢!!(在线等)
- 关于一个IPv4数据报转换成IPv6的模拟程序
我这里就记录了被爬的信息
希望www203(水户洋平)能够说得详细一点!
在asp中好像是有获得SCRIPT_NAME的函数,用这来判断!
不知道这个在java中是怎么处理的阿?
我也想学
java中怎样获得像在asp中是有获得SCRIPT_NAME值的函数阿?
我觉得我来csdn不是只为了达到多少积分吧,更重要的还是大家一起交流阿!
如果你要多点分,我可以追加给你的阿!
也许一些web服务器和应用服务器都有访问日志纪录,但是这个日志里包含很多信息,我是只想要那些关于spider的爬行纪录,不知道该如何处理阿?
如果人家刷你的网站鬼知道是谁访问了你的网站!
每个人都可以说自己是baidu spider或google sprider
给你答案:先在web.xml中加这么几条
<filter>
<filter-name>FileFilter</filter-name>
<filter-class>com.abc.FileFilter</filter-class>
</filter>
<filter-mapping>
<filter-name>FileFilter</filter-name>
<url-pattern>/*.jsp</url-pattern>
</filter-mapping>
这是把所有的访问xxx.jsp的都先通过com.abc.FileFilter这个类,这样就好记录了
com.abc.FileFilter:import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;import javax.servlet.*;
import javax.servlet.http.HttpServletRequest;
import java.util.Date;
public class FileFilter
implements Filter {
public void init(FilterConfig config) throws javax.servlet.ServletException {
} private static Log log = LogFactory.getLog(FileFilter.class); private StringBuffer sb; public void doFilter(ServletRequest request, ServletResponse response,
FilterChain chain) throws java.io.IOException,
javax.servlet.ServletException {
HttpServletRequest hrequest = (HttpServletRequest) request;
sb = new StringBuffer();
String uri = hrequest.getServletPath();
uri = uri.toLowerCase();
String referer = request.getHeader("referer");
log.debug(referer);//=================这里记录访问记录等信息
if (uri.startsWith("/list-")) {//================这里是返回到你的页面,具体改一下
hrequest.getRequestDispatcher(sb.append("/search.jsp?action=singer&keyword=").append(uri.substring(8, uri.length()).replaceAll(".jsp", "")).toString()).forward(request, response);
sb = null;
}
} public void destroy() {
}
}分不是问题,这只是个帐号,只是看你对这个问题的重视程度而已,所以上面我才说“才20分”