最近公司网站即将上线但是数据库中没有数据, 所以老大让俺写一个数据采集程序, 去其他网站上把数据抓取过来, 但是我不知道咋写的。做过的大神给点示例代码或者说说思路啊。 小弟拜托了!!!!!!!!!!!!!
解决方案 »
- 谁能介绍一下AJax-Jquery框架的特点
- 做个导入试题库的功能
- 我得到了一个josn格式字符串,想要分析它并得到想要的值要怎么做
- 父页面中的iframe 取值到子页面jquery(facebox) div中
- 如何给button添加服务器方法
- 委托有什么用?在什么情况下用委托。
- 请问怎样在一个窗口中关闭另一个窗口?
- 调用一个函数的问题????
- Image Iid=(Image) this.Datalist.Items[i].FindControl ("reimage"); 为什么会错呢
- 求助高手!WEB开发
- 今天发现一个网站的js文件下载不了,IE临时文件中也没有,用的啥技术?
- 一个奇怪的问题 高手进来看看
WebResponse myRes = myReq.GetResponse();
Stream resStream = myRes.GetResponseStream();
StreamReader sr = new StreamReader(resStream, Encoding.GetEncoding("utf-8"));
result = sr.ReadToEnd();
myRes.Close();
resStream.Close();
sr.Close(); //读取html文件 MatchCollection allMatchResults = null;
for (int i = 1; i <= n; i++)
{
string str = "id=\""+i.ToString()+"\"";
if (result.IndexOf(str) >= 0)
{
result = result.Substring(result.IndexOf(str));
allMatchResults = Regex.Matches(result, "(<a[^>]*>).*?(</a>)", RegexOptions.IgnoreCase);
if (allMatchResults.Count > 0)
{
string lianjie = allMatchResults[0].Value;
lianjie = lianjie.Replace("background-image", "");
lianjie = lianjie.Replace("onmousedown=", "");
lianjie = lianjie.Replace("<em>", "");
lianjie = lianjie.Replace("</em>", "");
strs.Add(lianjie);
}
}
}
return strs;你看下strs 就知道了。
2.利用正则或者HTMLParser来解析并匹配你要抓取的数据(匹配规则根据你最终内容而变)