最近需要实现一个对特定的网站分析,然后做个能根据用户输入不同的关键字来取到该网站上相关的用户想要的信息!!这次分都给一个解释过程最清楚的人  谢谢  本人初学者方面  所以请大家能讲的有概括性一点  要不小弟就给搞晕了  再次感谢!

解决方案 »

  1.   

    噢  这样啊  分我没有多少了  不过我可以重新说明我的问题例如:有一段HTML源码,要求取到其中所有超链接中的链接地址,显示给用户看 
     
    要用到哪些字符串的操作方法?比如substring谢谢 提醒我没说清楚  呵呵
      

  2.   

    #6楼 得分:0回复于:2010-06-30 12:14:31这种情况在公司里很多时候都要求用正则表达式获取的。你就把网页的源代码当成一个字符串不就行了,搜到链接的名字,再找到那个链接的地址 
     
    正则表达式  没用过   不过老板也是这个意思  如果当成字符串处理的话 用什么方法  substring 要截取长度啊  链接地址的长度用没办法确定。
    有么有高手给解释下怎么个用正则表达式来做这种操作的流程谢谢!!!
      

  3.   

    自己看看正则表达式就O了
    根据链接的格式写 正则表达式。
    然后在取到的html中匹配就可以了
      

  4.   

    post传值抓取数据
    HttpWebRequest request = (HttpWebRequest)HttpWebRequest.Create("");
    request.UserAgent = "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; .NET CLR 2.0.50727; "                +".NET CLR 3.0.04506.648; .NET CLR 3.5.21022)";
    request.Method = "post";
    byte[] data = encoding.GetBytes("");
    request.ContentType = "application/x-www-form-urlencoded";
    request.ContentLength = data.Length;
    using (Stream reqStream = request.GetRequestStream())
    {
       reqStream.Write(data, 0, data.Length);
       reqStream.Close();
     }
      

  5.   

      恩  用正则表达式我可以理解了  这要写好相应的正则表达式就行  
    现在新的问题出现了  
    比如:
    单击按钮模拟向百度传入一个request  就是要搜索的内容 。。  然后在模拟单击百度搜索按钮   获取新网页的数据
      

  6.   

    这个是跟点击百度的那个搜索按钮是没关系的
    首先在百度搜索一个东西,然后跳转到搜索结果页面
    取出这个页面的url,分析那个参数是你搜索的关键字,
    然后在你的程序中用任意输入的关键字替换掉,然后把这个url当做请求去抓取。