现在我想用JavaScript做一个简单的功能,就是自动抓取一个页面中的特定内容 
比如说http://www.baidu.com这个页面,我现在要抓取“把百度设为首页”这几个字,我的代码该怎么写啊? 
哪位高手帮帮忙啊? 

解决方案 »

  1.   

    关键是抓的内容是基于什么规则,我曾经做了一个软件,用户选择网页某区域,程序自动计算出该区域的xpath,并抓取。
      

  2.   

    js can not cross domain.
    ,try give up.
    use any other server language instead
      

  3.   

    是的~  楼上正解!
    楼主直接放弃吧,javascript不可能搞定的!
    这就是所谓的跨域问题,
    你写代码的网页,和想抓取甚至想操作的网页,这两个!只要是主域名不一样!就甭想,
    当然对你来说自己网页抓自己的网页到是可以,但也没什么意义了~
    如果你真的做到了跨域,这就是漏洞!很快就出补丁给你补了!
      

  4.   

    哪Ajax有没有解决方法勒  有也可以的
      

  5.   

    下面的代码希望对你有用string url = "http://www.baidu.com";WebRequest request = WebRequest.Create(url);
    WebResponse response = request.GetResponse();
    Stream resStream = response.GetResponseStream();
    //百度搜索用的是GB2312编码,所以利用HttpUtility.UrlEncode要做一个简单转换
    StreamReader sr = new StreamReader(resStream, System.Text.Encoding.GetEncoding("GB2312"));string html = sr.ReadToEnd();resStream.Close();
    sr.Close();其中html 就是获取的源代码。得到之后匹配正则表达式吧