c#抓取用户需要的网站的特定内容 最近需要实现一个对特定的网站分析,然后做个能根据用户输入不同的关键字来取到该网站上相关的用户想要的信息!!这次分都给一个解释过程最清楚的人 谢谢 本人初学者方面 所以请大家能讲的有概括性一点 要不小弟就给搞晕了 再次感谢! 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 噢 这样啊 分我没有多少了 不过我可以重新说明我的问题例如:有一段HTML源码,要求取到其中所有超链接中的链接地址,显示给用户看 要用到哪些字符串的操作方法?比如substring谢谢 提醒我没说清楚 呵呵 #6楼 得分:0回复于:2010-06-30 12:14:31这种情况在公司里很多时候都要求用正则表达式获取的。你就把网页的源代码当成一个字符串不就行了,搜到链接的名字,再找到那个链接的地址 正则表达式 没用过 不过老板也是这个意思 如果当成字符串处理的话 用什么方法 substring 要截取长度啊 链接地址的长度用没办法确定。有么有高手给解释下怎么个用正则表达式来做这种操作的流程谢谢!!! 自己看看正则表达式就O了根据链接的格式写 正则表达式。然后在取到的html中匹配就可以了 post传值抓取数据HttpWebRequest request = (HttpWebRequest)HttpWebRequest.Create("");request.UserAgent = "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; .NET CLR 2.0.50727; " +".NET CLR 3.0.04506.648; .NET CLR 3.5.21022)";request.Method = "post";byte[] data = encoding.GetBytes("");request.ContentType = "application/x-www-form-urlencoded";request.ContentLength = data.Length;using (Stream reqStream = request.GetRequestStream()){ reqStream.Write(data, 0, data.Length); reqStream.Close(); } 恩 用正则表达式我可以理解了 这要写好相应的正则表达式就行 现在新的问题出现了 比如:单击按钮模拟向百度传入一个request 就是要搜索的内容 。。 然后在模拟单击百度搜索按钮 获取新网页的数据 这个是跟点击百度的那个搜索按钮是没关系的首先在百度搜索一个东西,然后跳转到搜索结果页面取出这个页面的url,分析那个参数是你搜索的关键字,然后在你的程序中用任意输入的关键字替换掉,然后把这个url当做请求去抓取。 winform 仿QQ记住密码功能怎么实现~~~~~~~~~ C#中如何使用AJAX实现在textbox中每输入一个字母 显示相应的备选项 我要崩溃了,关于dataGridView的问题 关于右键菜单的问题 C#调用dephi写的dll问题 关于类型转换的问题,可能涉及到操作符重载 DataGridView怎么弄个标题出来? datarow的问题,未将对象引用设置到对象的实例 SQL的正则表达式 如何将textbox的string类型的返回值转换成int型 c# TCP socket的一个问题 支付宝的登陆密码和支付密码怎么自动填上去?
要用到哪些字符串的操作方法?比如substring谢谢 提醒我没说清楚 呵呵
正则表达式 没用过 不过老板也是这个意思 如果当成字符串处理的话 用什么方法 substring 要截取长度啊 链接地址的长度用没办法确定。
有么有高手给解释下怎么个用正则表达式来做这种操作的流程谢谢!!!
根据链接的格式写 正则表达式。
然后在取到的html中匹配就可以了
HttpWebRequest request = (HttpWebRequest)HttpWebRequest.Create("");
request.UserAgent = "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; .NET CLR 2.0.50727; " +".NET CLR 3.0.04506.648; .NET CLR 3.5.21022)";
request.Method = "post";
byte[] data = encoding.GetBytes("");
request.ContentType = "application/x-www-form-urlencoded";
request.ContentLength = data.Length;
using (Stream reqStream = request.GetRequestStream())
{
reqStream.Write(data, 0, data.Length);
reqStream.Close();
}
现在新的问题出现了
比如:
单击按钮模拟向百度传入一个request 就是要搜索的内容 。。 然后在模拟单击百度搜索按钮 获取新网页的数据
首先在百度搜索一个东西,然后跳转到搜索结果页面
取出这个页面的url,分析那个参数是你搜索的关键字,
然后在你的程序中用任意输入的关键字替换掉,然后把这个url当做请求去抓取。