这里的大侠们。能帮忙的记得花点时间 帮忙喔~~分数不多请见谅~~
获取主页的源文件是可以了。我想在此源文件里进行搜索 获得该主页的标题名和其关键字,怎么弄?还有要象网络蜘蛛那样获取主页上的连接URL 是不是也在源文件分析得到的??
希望大家给些资料或者 意见参考一下。
谢谢喔~~~
如果有资料的话,发到我邮箱里[email protected]
谢谢啊~~
获取主页的源文件是可以了。我想在此源文件里进行搜索 获得该主页的标题名和其关键字,怎么弄?还有要象网络蜘蛛那样获取主页上的连接URL 是不是也在源文件分析得到的??
希望大家给些资料或者 意见参考一下。
谢谢喔~~~
如果有资料的话,发到我邮箱里[email protected]
谢谢啊~~
解决方案 »
- Delphi 可以将函数在定义时指明连接到或者继承到某个函数吗?
- 分在我帐户上都发霉了,散出来晾一下2
- sqlserver并发取最大单据号
- 调用存储过程的问题。
- IDE开发工具走下坡路 Borland欲开发咨询服务
- 怎么样建立一张空白的数据表?
- 抓图问题
- TStoredProc调用存储过程问题!十万火急(另开新号加100分)
- 2000系统和XP系统都出现 InstallShied Engine 错误,不能修复,请帮助!马上给分!
- 寻求:关于“插入式打卡机”方面的资料
- 想要设计一个通用的环行缓冲区管理器对象来管理不同的Record类型的数据,应该怎样写?
- FastReport2.5的Rich控件能不能设置行距啊?
有资料吗?
如今的情况如下:
以网易为例子。
条件里:输入www.163.com 按搜索
在当前页下搜索出60条不重复的网址(一条一条的存入记录集中--本次存储用memo) 在每条存时 都会跟Memo里已存在的记录进行比较,排除重复的。
写了个循环,步骤同上。看解析
for i:=1 to Memo1.Lines.Count-1 do//已存入的数据记录总数
begin
SonUrl:= Memo1.Lines.Strings[i];//进行逐条的获取。
GetAllUrl(SonUrl);//这是获取SonUrl网址下的源码里的 所有连接地址
end;
但是这样只能做到二层的搜索。这上面的循环只是第二层搜索,如果说是要进行第三层搜索,即对第二步搜索的结果集里每一条进行获取连接,得再写类似一样的循环。
for sallUrl:=i to Memo1.Lines.Count-1 do//从第二层搜索出来的记录开始
begin
SonUrl:= Memo1.Lines.Strings[sallUrl];
GetAllUrl(SonUrl);//再进行逐一对该地址里所有连接地址的获取。
end;
问题是网页里的层数是未知的,如果说要全部都搜索的话,那不知要这样的函数写多少个,这样的话是很不合理的。
本人想到的一种方法是 只写一个这样循环,及时获取memo中发生变化的记录数,然后再传入那总数里。(但是据了解,这个循环里的总数只能是常量,不能发生变化的。)
朋友,你们要是有好的方法,请告诉我。我的邮件是[email protected]
谢谢谢谢!!!!!!