国外的一个c#开源通用蜘蛛程序!带索引程序!少有的东西!有兴趣的研究下
http://www.fl800.net/search/MiniSpider.rar
程序也许有些BUG!高手可以改改!
http://www.fl800.net/search/MiniSpider.rar
程序也许有些BUG!高手可以改改!
解决方案 »
- 如何通过图片的路径及名称将图片显示在GridView中
- 关于页面暴利登录的问题
- 求一随机分配数字的方法
- 请教个具体问题哈!!!!!!!!!!!!!!希望高手来解答下!!!
- Request.Cookies 问题
- "从字符串“insert into [材料购进表] values('2009”到类型“Double”的转换无效。"
- 将TextBox中日期格式的字符串转换为DateTime,写入数据库
- 谁知道ObjectDataSource.CacheKeyDependency实际用法?
- 在ASP.net(C#)怎么使用adodb.stream的open 方法?
- 数据内容由查询语句动态生成然后用两个DataGrid显示出来,如何让它们不重叠
- 有没有什么办法可以让页面加载的时候自动跳到页尾。
- 如何切割用户上传的图片
我是Win2k SQL2K .Net2.0 ?????????????????????????????????????????????????????????
程序我已经汉化过!1个小时后停止下载!不喜欢的就不要下!当我白干事!
已经下了东西朋友重新下!觉的好的来这里说下
在这个区,发所谓"开源蜘蛛"的已经不是一次两次了,
每回都这样,没有源码,运行的朋友说运行不了,实际上就是病毒或者木马.参考帖子:
http://community.csdn.net/Expert/TopicView3.asp?id=4910562
很巧啊,那位发帖的也是打包打错了...
case 1:
{
// 当打开url文件时
this.openFileDialog1.Filter="文本文件(*.txt)|*.txt";
this.openFileDialog1.Multiselect=false;
string fileName;
if(this.openFileDialog1.ShowDialog()==DialogResult.OK)
{
fileName=openFileDialog1.FileName;
this.AddUrlContent(fileName);
}
}
break;
case 2:
{
// 当自动生成url时
if(this._frmAddCreator==null)
{
this._frmAddCreator=new FormAddCreator();
}
else
{
if(this._createFormClosed)
{
this._frmAddCreator=new FormAddCreator();
this._createFormClosed=false;
}
}
this._frmAddCreator.Closed +=new System.EventHandler(this.FormAddCreator_Closed);
this._frmAddCreator.onSendExpression +=new WinMsgHandler(this.AddUrlExp);
this._frmAddCreator.ShowDialog();
}
break;
case 3:
{
// 当要抓取时
if(this._frmInterWebBrowser==null)
{
this._frmInterWebBrowser=new FormInterWebBrowser();
}
else
{
if(this._interWebBrowserClosed)
this._frmInterWebBrowser=new FormInterWebBrowser();
}
这是其中的一段代码
谢谢
[email protected]
public void LoadDocument(string url)
{
_url=url;
try
{
byte[]data=_wc.DownloadData(_url);
_pageCode=Encoding.Default.GetString(data).ToLower();
}
catch(System.Exception e)
{
_er.RecordError("Pos:HtmlParser::LoadDocument. Info:"+e.Message);
}
} //将分析器初始化,用来分析网页
public void LoadParser()
{
if(_pageCode!=null)
_doc.body.innerHTML=_pageCode;
else
_er.RecordError("Pos:HtmlParser::LoadParser. Info:Can't visit url"+_url);
}
//抽取文本
public string GetInnerText()
{
//获得所有图象链接
public bool GetAllImgLinks(out object oLinks)
{
if(_doc==null)...............
.....................
//抽取网页链接
public bool GetAllAnchorLinks(out object oLinks)
{
if(_doc==null)
{
在这个区,发所谓"开源蜘蛛"的已经不是一次两次了,
每回都这样,没有源码,运行的朋友说运行不了,实际上就是病毒或者木马.参考帖子:
http://community.csdn.net/Expert/TopicView3.asp?id=4910562
很巧啊,那位发帖的也是打包打错了...
----------------------------------
http://community.csdn.net/Expert/topic/5006/5006087.xml?temp=.7484247
C#写的一个垂直搜索/反向索引!程序不打算升级!提供国大家研究
里面的功能设置自己去研究!需要用到正折!索引功能强大!能时时添加索引!
地址:http://www.fl800.net/search/so.rar
程序上的问题不用来找我自己研究!
----------------------------------------------
小弟我新做的小站上线,大家来捧个场啊 www.5LC.cn
我贴了点代码证实下!有兴趣的给我留站内短信!
====================================================这个马甲终于出来了么,看看帖:
--------------------
?有开发好的全套成熟的垂直搜索吗(智能蜘蛛+索引程序+分词+前台)程序语言C#?我们公司50W以内求购(ww37383048) 20 7 9-10 23:16 管理
?海量搜索技术研究论坛!里面有很多技术方面的讨论!(国内最大的搜索技术研究公司!)(ww37383048) 1 0 9-10 21:13 管理
--------------------还有:
--------------
?吐血提供一个价值2W搜索程序给大家(c#版带蜘蛛的哦)(WW1314521) 20 29 8-11 14:55 管理
?C#版采集程序带前台/网络蜘蛛(开源代码给大家)(WW1314521) 20 9 8-8 13:53 管理
?C#版采集程序带前台/网络蜘蛛(开源代码给大家)(WW1314521) 20 2 7-27 00:37 管理
?RMB10W以内求够搜索程序(带蜘蛛的)和新闻系统(带采集标签)(WW1314521) 20 3 7-18 07:55 管理
--------------------------------
这个 WW1314521 也是LZ的马甲吧,毕竟,里边提供下载的地址和楼主是一个网站的,
不要以为做了点什么事别人就不知道, 做人要厚道