现在我想用JavaScript做一个简单的功能,就是自动抓取一个页面中的特定内容 现在我想用JavaScript做一个简单的功能,就是自动抓取一个页面中的特定内容 比如说http://www.baidu.com这个页面,我现在要抓取“把百度设为首页”这几个字,我的代码该怎么写啊? 哪位高手帮帮忙啊? 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 关键是抓的内容是基于什么规则,我曾经做了一个软件,用户选择网页某区域,程序自动计算出该区域的xpath,并抓取。 js can not cross domain.,try give up.use any other server language instead 是的~ 楼上正解!楼主直接放弃吧,javascript不可能搞定的!这就是所谓的跨域问题,你写代码的网页,和想抓取甚至想操作的网页,这两个!只要是主域名不一样!就甭想,当然对你来说自己网页抓自己的网页到是可以,但也没什么意义了~如果你真的做到了跨域,这就是漏洞!很快就出补丁给你补了! 哪Ajax有没有解决方法勒 有也可以的 下面的代码希望对你有用string url = "http://www.baidu.com";WebRequest request = WebRequest.Create(url);WebResponse response = request.GetResponse();Stream resStream = response.GetResponseStream();//百度搜索用的是GB2312编码,所以利用HttpUtility.UrlEncode要做一个简单转换StreamReader sr = new StreamReader(resStream, System.Text.Encoding.GetEncoding("GB2312"));string html = sr.ReadToEnd();resStream.Close();sr.Close();其中html 就是获取的源代码。得到之后匹配正则表达式吧 关于text-indent的疑惑 菜鸟问题啊 怎样在页面表格中显示从JS处理得到的值? JS 多个特效 有冲突?。 js怎么获取一台主机中的多个IP? 大家好,想请大家帮个忙,不算复杂的一个小问题 使用iscroll滑动区域内的div onclick事件单击一次触发了两次 asp 调用javascript变量问题,? 中文转码问题 navigator.mediaDevices.getUserMedia()谷歌都无法使用 脚本编程问题javascript [讨论帖]google是如何做到的?
,try give up.
use any other server language instead
楼主直接放弃吧,javascript不可能搞定的!
这就是所谓的跨域问题,
你写代码的网页,和想抓取甚至想操作的网页,这两个!只要是主域名不一样!就甭想,
当然对你来说自己网页抓自己的网页到是可以,但也没什么意义了~
如果你真的做到了跨域,这就是漏洞!很快就出补丁给你补了!
WebResponse response = request.GetResponse();
Stream resStream = response.GetResponseStream();
//百度搜索用的是GB2312编码,所以利用HttpUtility.UrlEncode要做一个简单转换
StreamReader sr = new StreamReader(resStream, System.Text.Encoding.GetEncoding("GB2312"));string html = sr.ReadToEnd();resStream.Close();
sr.Close();其中html 就是获取的源代码。得到之后匹配正则表达式吧