用fsockopen获取百度的搜索页 php fsockopen 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 添加 useragent 试试,参考:http://tuzwu.iteye.com/blog/723260 当然试过了,已经参照Fiddler2截获的数据进行了全模仿 奇了怪了,用file_get_contents确实可行,但用我的方法只是百度不能获取,其他网址都成功,这是为什么呢? 字符集编码没问题,我已经反复试验过了,同样的编码,file_get_contents是可以的 不知道你是怎么写的$fp = fsockopen("www.baidu.com", 80, $errno, $errstr, 30);$out = "GET /s?wd=音箱&pn=20 HTTP/1.1\r\n";$out .= "Host: www.baidu.com\r\n";$out .= "Connection: Close\r\n\r\n";fwrite($fp, $out);while (!feof($fp)) { echo fgets($fp, 128);}fclose($fp);这回不贴图了,贴个数据片段Resource id #2HTTP/1.1 200 OKDate: Fri, 29 Nov 2013 07:21:48 GMTServer: BWS/1.0Content-Length: 109229Content-Type: text/html;charset=utf-8Cache-Control: privateBDPAGETYPE: 3BDUSERID: 0BDQID: 0xba09dfbd018d026bSet-Cookie: BDSVRTM=245; path=/Set-Cookie: H_PS_PSSID=4316_1462_4181_4261; path=/; domain=.baidu.comSet-Cookie: BAIDUID=93A4FEBC6A24E74B727FEE7001E65B50:FG=1; expires=Fri, 29-Nov-43 07:21:47 GMT; path=/; domain=.baidu.comP3P: CP=" OTI DSP COR IVA OUR IND COM "Connection: Close...... ><em>音箱</em>频道</a></h3><div class="c-abstract"><em>音箱</em>报价中心 品牌 漫步者 BOSE 麦博 惠威 JBL 飞利浦 奋达 罗技 小米 三诺 创新 朗琴 更多>> 价格 100元以下 101-200元 201-300元 301-500元 501-800元...</div><div class="f13"><span class="g">speaker.pcpop.com/soundbox/ 2013-11-11 </span><div class="c-tools" id="tools_181886679191780905" data-tools="{title:'音箱频道',url:'http://www.baidu.com/link?url=cbXRMjLooIGrQU8dRKO-PeET1cIKggj-w0EfWsYK3URyrmdve97fOPPs4_qKXBsI'}"><a class="c-tip-icon"><i class="c-icon c-icon-triangle-down-g"></i></a></div>- <a data-nolog href="http://cache.baiducontent.com/c?m=9f65cb4a8c8507ed4fece763105795314a0dd7232bd7a7572e96ce0a84642c101a39fefa7a654c528398367a15ea141cbcff2104371454b18cb9fc5daabd&p=9049cd15d9c046ab1dfbc7710f089c&newp=9f64c54ad5c445fe03b2d02d021498231610db2151d2d1172e8fcc0c&user=baidu&fm=sc&query=%D2%F4%CF%E4&qid=&p1=22" target="_blank" class="m">百度快照</a><span data-nolog class="liketip" id="like_181886679191780905"></span></div><div style="display:none;padding:3px 0 0 0" class="extquery" data-extquery="音箱 频道"><a href="/s?wd=%E9%9F%B3%E7%AE%B1+%E9%A2%91%E9%81%93&f=0&ie=utf-8&rsv_crq=1" target="_blank" style="font-size:13px;font-weight:bold;">查看更多关于“<em>音箱 频道</em>”的内容 >></a></div></td></tr></table><table class="result" id="23" srcid="" tpl="se_st_default" data-click="{'rsv_bdr':'0'}" ><tr><td class="c-default" ><h3 class="t"><a data-click="{ 'F':'778317EA', 'F1':'9D73F1E4', 'F2':'4CA6DD6B', 'F3':'54E5243F', 'T':'1385709708', 'y':'F3D2FEDF' }" href="http://www.baidu.com/link?url=iHdhI9m-N3i0M6QsBp8zjalqAtClICWD28BH_hXsPvRlaAAlSHQ9pzL0AZsRgan2" target="_blank" ><em>音箱</em>_电脑<em>音箱</em>_<em>音响</em>-IT168<em>音箱</em>频道</a></h3><div class="c-abstract">IT168<em>音箱</em>频道向您提供最专业最权威的<em>音箱</em>、<em>音响</em>产品评测,为您带来最新最准确的<em>音箱</em>、<em>音响</em>产品资讯报价信息,给您提供各种档次<em>音箱</em>和<em>音响</em>产品评析,帮您更好的选购...</div><div class="f13"><span class="g">sound.it168.com/ 2013-11-15 </span><div class="c-tools" id="tools_9089855379744365164" data-tools="{title:'音箱_电脑音箱_音响-IT168音箱频道',url:'http://www.baidu.com/link?url=iHdhI9m-N3i0M6QsBp8zjalqAtClICWD28BH_hXsPvRlaAAlSHQ9pzL0AZsRgan2'}"><a class="c-tip-icon"><i class="c-icon c-icon-triangle-down-g"></i></a></div><span class="certification" certification_key="23" dis_url="sound.it168.com/"><a href="#" class="c-icon c-icon-v sam-icon-v" onclick="return false"></a></span> <script>bds.ready(function(){ 无论你发出的请求是什么编码的,返回的总是 utf-8 的因为他的头部有 Content-Type: text/html;charset=utf-8 领教,多谢了。我再对照研究下。另外,google的我一直不能成功,版主能再费时试下吗?http://www.google.com.hk/search?q=音箱&start=10 http://blog.csdn.net/jdgdf566/article/details/13632111 数组存放图片问题! PHP缓存作怪还是Apache没配置好 救命啊!!! 两张百万级的数据表,联合查询的问题 請問大家:怎樣才能禁止用戶使用工具欄 "上一頁" 的功能???謝謝!!! 为何session_destroy()总是出错? 想做个新闻系统,打算用longblob存放正文,但似乎无法输入表格,高分求教! 什么判断访问者是否是中文用户? PHP上传图象大小问题 webservice问题,soap问题,响应问题-求大神!大神在哪? PHP香港服务器用file_get_contents 抓取天猫的数据都是繁体的 smarty模板中的斜杠的定义到底在哪里
参考:http://tuzwu.iteye.com/blog/723260
$out .= "Host: www.baidu.com\r\n";
$out .= "Connection: Close\r\n\r\n";fwrite($fp, $out);
while (!feof($fp)) {
echo fgets($fp, 128);
}
fclose($fp);
这回不贴图了,贴个数据片段
Resource id #2HTTP/1.1 200 OK
Date: Fri, 29 Nov 2013 07:21:48 GMT
Server: BWS/1.0
Content-Length: 109229
Content-Type: text/html;charset=utf-8
Cache-Control: private
BDPAGETYPE: 3
BDUSERID: 0
BDQID: 0xba09dfbd018d026b
Set-Cookie: BDSVRTM=245; path=/
Set-Cookie: H_PS_PSSID=4316_1462_4181_4261; path=/; domain=.baidu.com
Set-Cookie: BAIDUID=93A4FEBC6A24E74B727FEE7001E65B50:FG=1; expires=Fri, 29-Nov-43 07:21:47 GMT; path=/; domain=.baidu.com
P3P: CP=" OTI DSP COR IVA OUR IND COM "
Connection: Close...... ><em>音箱</em>频道</a></h3><div class="c-abstract"><em>音箱</em>报价中心 品牌 漫步者 BOSE 麦博 惠威 JBL 飞利浦 奋达 罗技 小米 三诺 创新 朗琴 更多>> 价格 100元以下 101-200元 201-300元 301-500元 501-800元...</div><div class="f13"><span class="g">speaker.pcpop.com/soundbox/ 2013-11-11 </span><div class="c-tools" id="tools_181886679191780905" data-tools="{title:'音箱频道',url:'http://www.baidu.com/link?url=cbXRMjLooIGrQU8dRKO-PeET1cIKggj-w0EfWsYK3URyrmdve97fOPPs4_qKXBsI'}"><a class="c-tip-icon"><i class="c-icon c-icon-triangle-down-g"></i></a></div>- <a data-nolog href="http://cache.baiducontent.com/c?m=9f65cb4a8c8507ed4fece763105795314a0dd7232bd7a7572e96ce0a84642c101a39fefa7a654c528398367a15ea141cbcff2104371454b18cb9fc5daabd&p=9049cd15d9c046ab1dfbc7710f089c&newp=9f64c54ad5c445fe03b2d02d021498231610db2151d2d1172e8fcc0c&user=baidu&fm=sc&query=%D2%F4%CF%E4&qid=&p1=22"
target="_blank"
class="m">百度快照</a><span data-nolog class="liketip" id="like_181886679191780905"></span></div><div style="display:none;padding:3px 0 0 0" class="extquery" data-extquery="音箱 频道"><a href="/s?wd=%E9%9F%B3%E7%AE%B1+%E9%A2%91%E9%81%93&f=0&ie=utf-8&rsv_crq=1" target="_blank" style="font-size:13px;font-weight:bold;">查看更多关于“<em>音箱 频道</em>”的内容 >></a></div></td></tr></table><table class="result" id="23" srcid="" tpl="se_st_default" data-click="{'rsv_bdr':'0'}" ><tr><td class="c-default" ><h3 class="t"><a
data-click="{
'F':'778317EA',
'F1':'9D73F1E4',
'F2':'4CA6DD6B',
'F3':'54E5243F',
'T':'1385709708',
'y':'F3D2FEDF'
}"
href="http://www.baidu.com/link?url=iHdhI9m-N3i0M6QsBp8zjalqAtClICWD28BH_hXsPvRlaAAlSHQ9pzL0AZsRgan2"
target="_blank"
><em>音箱</em>_电脑<em>音箱</em>_<em>音响</em>-IT168<em>音箱</em>频道</a></h3><div class="c-abstract">IT168<em>音箱</em>频道向您提供最专业最权威的<em>音箱</em>、<em>音响</em>产品评测,为您带来最新最准确的<em>音箱</em>、<em>音响</em>产品资讯报价信息,给您提供各种档次<em>音箱</em>和<em>音响</em>产品评析,帮您更好的选购...</div><div class="f13"><span class="g">sound.it168.com/ 2013-11-15 </span><div class="c-tools" id="tools_9089855379744365164" data-tools="{title:'音箱_电脑音箱_音响-IT168音箱频道',url:'http://www.baidu.com/link?url=iHdhI9m-N3i0M6QsBp8zjalqAtClICWD28BH_hXsPvRlaAAlSHQ9pzL0AZsRgan2'}"><a class="c-tip-icon"><i class="c-icon c-icon-triangle-down-g"></i></a></div><span class="certification" certification_key="23" dis_url="sound.it168.com/"><a href="#" class="c-icon c-icon-v sam-icon-v" onclick="return false"></a></span> <script>
bds.ready(function(){
因为他的头部有 Content-Type: text/html;charset=utf-8
另外,google的我一直不能成功,版主能再费时试下吗?
http://www.google.com.hk/search?q=音箱&start=10