如何通过java来获取在asp中request.ServerVariables("SCRIPT_NAME")得到的值 我想通过java来获取执行脚本的名称,例如在asp中通过request.ServerVariables("SCRIPT_NAME")来获得,不知道在java或者jsp中怎么获取阿 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 获得配置文件中的内容吗?可以使用ServletContext类型的对象来获得 Mailbomb(网络咖啡http://blog.csdn.net/mailbomb):不是啊!最原始的想法是获得蜘蛛爬行纪录,上网查找之后,有通过asp来实现的,其中asp代码中就是request.ServerVariables("SCRIPT_NAME"),再去匹配现有的spider,获取信息!request.ServerVariables("SCRIPT_NAME")语句是获取执行脚本,我想通过jsp来实现,不知道如何获取阿? 是指除服务器地址后面的那段吧?request.getContextPath() + request.getServletPath()就可以 如果你的蜘蛛爬行是指类似google的robot访问记录,那么打开访问日志就可以记录它访问过的网页 如果 要判断到底是否google 的robot访问等,你需要判断request.getHeader("user-agent")是否包含googlebot字符 ChDw(米) :谢谢您提供这么多建议!我就是想得到比方google的robot访问纪录,但是我不知道访问日志是怎么一回事,以前在开发web系统的时候,没有接触到这一层。我想问个问题:如何纪录访问日志,服务器端应该如何配置阿? 访问日志就是Web服务器提供的记录功能,默认情况下可能没有打开(打开了会对性能有一定的影响)如果是Tomcat,则打开conf\server.xml,原来有一段可能是注释了的配置 <Valve className="org.apache.catalina.valves.FastCommonAccessLogValve" directory="logs" prefix="localhost_access_log." suffix=".txt" pattern="combined" resolveHosts="false"/>去掉注释使之生效,并且pattern改成combined(这样才会记录userAgent信息)这样在任何人访问网站(包括各种robot)都会在logs\localhost_access_log.2007-04-25.txt这样的文件中记录,你可以对这些文件分析测试就当然可能是做一个Robot出来,再或者自己编造一些access_log文件分析了除了Tomcat外,各种Web服务器普通都会提供类似的配置功能的,具体需要看相关文档 我把Tomcat的server.xml做了以下配置: <Valve className="org.apache.catalina.valves.FastCommonAccessLogValve" directory="logs" prefix="localhost_access_log." suffix=".txt" pattern="combined" resolveHosts="false"/>但是当他人通过IE访问的时候,会纪录该页面中所有的包含文件。比如:<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml" lang="zh-CN"><head><meta http-equiv="Content-Language" content="zh-CN" /> <link rel="stylesheet" href="/css/search_main.css" type="text/css" media="all" /><title>测试</title><script type="text/javascript" src="/js/search.js"></script></head><body><img src="/images/csdn_search_logo.gif" /></body></html>log文件中分别会纪录:本页面/css/search_main.css/js/search.js/images/csdn_search_logo.gif四条访问纪录,不知道该如何修改配置,才能正确的记录阿? 这个的确就是如此,因为IE的确向Tomcat同时请求了html, css, js, gif这个access_log会记录所有文件的,可能包含你不需要的记录,但是你可以在分析日志的时候去掉你认为不需要分析的记录 有关鼠标拖动button的问题!问了很多人,都没解决。。。。。。。 数据库连接池讨论 C3P0 or dbcp or proxool or .................散分讨论 关于建立文本框中如何设定用户输入字符的回显字符 C#源码转换成Java源码 应聘java程序员都考些什么题,请附上答案 一个怪问题 请问现在市场上主流的应用服务器报价分别是多少? 不知所措---郁闷!! 关于构建器的问题,大家帮忙看看 printf如何解决中英文对齐 关于网络通信的疑问 关于Swing JTable中CellRenderer,CellEditor之间的相互联系
可以使用ServletContext类型的对象来获得
最原始的想法是获得蜘蛛爬行纪录,上网查找之后,有通过asp来实现的,其中asp代码中就是request.ServerVariables("SCRIPT_NAME"),再去匹配现有的spider,获取信息!
request.ServerVariables("SCRIPT_NAME")语句是获取执行脚本,我想通过jsp来实现,不知道如何获取阿?
request.getContextPath() + request.getServletPath()就可以
request.getHeader("user-agent")是否包含googlebot字符
谢谢您提供这么多建议!
我就是想得到比方google的robot访问纪录,但是我不知道访问日志是怎么一回事,以前在开发web系统的时候,没有接触到这一层。
我想问个问题:如何纪录访问日志,服务器端应该如何配置阿?
如果是Tomcat,则打开conf\server.xml,原来有一段可能是注释了的配置
<Valve className="org.apache.catalina.valves.FastCommonAccessLogValve"
directory="logs" prefix="localhost_access_log." suffix=".txt"
pattern="combined" resolveHosts="false"/>去掉注释使之生效,并且pattern改成combined(这样才会记录userAgent信息)这样在任何人访问网站(包括各种robot)都会在logs\localhost_access_log.2007-04-25.txt这样的文件中记录,
你可以对这些文件分析测试就当然可能是做一个Robot出来,再或者自己编造一些access_log文件分析了
除了Tomcat外,各种Web服务器普通都会提供类似的配置功能的,具体需要看相关文档
<Valve className="org.apache.catalina.valves.FastCommonAccessLogValve"
directory="logs" prefix="localhost_access_log." suffix=".txt"
pattern="combined" resolveHosts="false"/>
但是当他人通过IE访问的时候,会纪录该页面中所有的包含文件。比如:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" lang="zh-CN">
<head>
<meta http-equiv="Content-Language" content="zh-CN" />
<link rel="stylesheet" href="/css/search_main.css" type="text/css" media="all" />
<title>测试</title>
<script type="text/javascript" src="/js/search.js"></script>
</head>
<body>
<img src="/images/csdn_search_logo.gif" />
</body>
</html>log文件中分别会纪录:
本页面
/css/search_main.css
/js/search.js
/images/csdn_search_logo.gif
四条访问纪录,不知道该如何修改配置,才能正确的记录阿?