求教如何抓取网页数据并存入数据库? 我现在用ASP.NET+C# 实现一个实例,数据库中存放有URL的ID和地址,还有Text用来存放抓取URL之后过滤一些不必要字符后的字符串。请问具体怎么实现?尽量提供代码,太谢谢了! 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 你是不是想找“小偷程序”?http://www.enet.com.cn/article/2004/0825/A20040825337381.shtmlhttp://blog.hnce.net/post/188.htmlhttp://dev.firnow.com/course/4_webprogram/asp.net/asp_netshl/2008324/106230.htmlhttp://www.chinaitweb.com/html/xueshengzhuanqu/net/2009/0529/137.htmlhttp://www.mycodes.net/104/2064.htm 建议研究一下,web-harvest一个java开源项目。在oschina.net上就能找到。 httpwebrequest,webclient抓取页面数据正则根据规则获取System.Net.WebClient wc = new System.Net.WebClient();Byte[] pageData = wc.DownloadData(""); string s= System.Text.Encoding.Default.GetString(pageData); 谢谢楼上的各位,小弟 现在找到了,但是还有一些问题,其一: 正则获取部分黑体的不正确,大家帮我改下吧;其二:这个程序网页url必须要自己输,如何从数据库读入url地址 并将过滤后的结果输入到数据库中,小弟再次感谢,自己实在是菜鸟,大家能帮帮我吗?感谢static void Main(string[] args) { byte[] buffer = getBytes("http://video.shishicai.cn/haoma/cqssc/list/120.aspx", null, null); string html = Encoding.UTF8.GetString(buffer); MatchCollection mc = Regex.Matches(html, @"{"(?(([a-z]|[A-Z])+(\d))"}"); Console.WriteLine(mc); Console.WriteLine("Close!"); Console.ReadKey(); } |ZYCWPF| RichTextbox 取得当前下划线,有时有,有时没有 vs2010发布时提示缺少个Client_x86_x64cs.exe,你们会吗? C# uint与int 怎么把本地路径转换为服务器路径? c#编写对某个qq好友发送信息的窗口软件 DataGridView显示明细 求救!!!! (散分) 超难度的问题!高手进来看看!!! 问一个字符串的简单问题? 誰有關于java和C#之間的比較的文章啊﹐救急啊 C# Winform 软件自动升级怎么做?具体代码怎么写?? 我想问各位大侠一个实现方法(正则表达式的写法)
正则根据规则获取
System.Net.WebClient wc = new System.Net.WebClient();
Byte[] pageData = wc.DownloadData("");
string s= System.Text.Encoding.Default.GetString(pageData);
static void Main(string[] args)
{
byte[] buffer = getBytes("http://video.shishicai.cn/haoma/cqssc/list/120.aspx", null, null);
string html = Encoding.UTF8.GetString(buffer);
MatchCollection mc = Regex.Matches(html, @"{"(?(([a-z]|[A-Z])+(\d))"}");
Console.WriteLine(mc);
Console.WriteLine("Close!");
Console.ReadKey();
}