我需要对 web 产生的访问日志进行分析.日志格式(.log 每行一个): 日志最少要考虑10万条,log文件大小<20M2006-03-14 02:45:02 211.95.79.178 GET /8084.html - 80 - 222.241.203.30 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1) 200 0 0/8084.html 被访问的文件名
222.241.203.30 访问者IP我主要想分析出
某个IP 一共访问多少次.
某个文件 一共被访问了多少次.
结果直接用 listview 或者其他什么表示出来.
-----------------------------------------------
DELPHI刚入门,怎样也想不出如何才能最快最稳定的分析出我想要的资料,于是使用了 SQLSERVER.
循环 LOG 中的所有行,再每行中又做 SQL循环 如果有该记录则 nums+1 否则 insert 当然大家也可以想象出这个速度有多慢了,测试时:10分钟才能循环 5000行左右. 实质上这个文件最少有10万行.而且CPU使用一直是100% 主要是 sqlserver 他就占用了80%. 希望大家能给个好的建议和代码.能快速的分析出结果,不用数据库是最好的了,直接把分析结果 再保存成TXT格式,只是我对文本操作也不熟,不知道该怎么做.
非常希望大侠们能给份好的 设计思想 和 核心代码,不胜感激.
222.241.203.30 访问者IP我主要想分析出
某个IP 一共访问多少次.
某个文件 一共被访问了多少次.
结果直接用 listview 或者其他什么表示出来.
-----------------------------------------------
DELPHI刚入门,怎样也想不出如何才能最快最稳定的分析出我想要的资料,于是使用了 SQLSERVER.
循环 LOG 中的所有行,再每行中又做 SQL循环 如果有该记录则 nums+1 否则 insert 当然大家也可以想象出这个速度有多慢了,测试时:10分钟才能循环 5000行左右. 实质上这个文件最少有10万行.而且CPU使用一直是100% 主要是 sqlserver 他就占用了80%. 希望大家能给个好的建议和代码.能快速的分析出结果,不用数据库是最好的了,直接把分析结果 再保存成TXT格式,只是我对文本操作也不熟,不知道该怎么做.
非常希望大侠们能给份好的 设计思想 和 核心代码,不胜感激.
一般,都是用现成工具的,如下面这篇:http://www.daima.com.cn/Info/130/Info39273/
而且我希望自己在这个功能上继续扩展.
用别人的统计工具,很多功能我不必要,但很多功能又不够强.
如果可以用别人的 我就不在DELPHI版发求助咯.我也希望通过写东西来尽量提高自己
主要涉及到的就是 大文本的操作,文本内容的比较.
并且提取出 重复次数最多TOP100