RT,抓取一些页面元素不多的网页还行,数据完整,但抓取数据量很大的页面就不行了,返回的数据总是只有前面一部分,如http://www.baidu.com,甚至连<head>标签中的数据都不完整,<body>则是完全没有- -||请各路大神指点下思路,如何才能获取到html页面的完整代码androidhtml

解决方案 »

  1.   

    确定是在android上测试的么?我刚也拷贝您的代码试了一下,打印出来的结果依旧不完整,结果如下:<!DOCTYPE html PUBLIC "-//WAPFORUM//DTD XHTML Mobile 1.0//EN" "http://www.wapforum.org/DTD/xhtml-mobile10.dtd"><html xmlns="http://www.w3.org/1999/xhtml"><!--STATUS OK--><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8" /><meta http-equiv="Cache-control" content="no-cache" /><style type="text/css">body {text-align:center;line-height:120%}form {margin-top:10px;padding:5px}img {border:0}#b {background-color:#dfdfdf;padding:2px 1px 3px 1px}#word {width:72%;line-height:180%}.bn {width:24%;border:0;background-color:#dfdfdf;color:black;font-size:14px;padding-bottom:2px}.lg {margin-top:30px}a {text-decoration:none;color:#545164;font-size:14px}.a {margin-top:20px}.b {margin-top:10px;font-size:12px;color:#b4b4b4}.d {margin-top:50px;font-size:14px}.h {color:red}</style><title>百度一下,你就知道</title></head><body><div class="wrap"><div class="lg"><img src="http://m.baidu.com/static/index/i.gif" alt="百度首页" /></div><form action="http://m.baidu.com/ssid=0/from=844b/bd_page_type=1/uid=ED33E3349E18F0B1DD42B0CE9649FE3B/s" method="get"><div id="b"><input type="text" name="word" maxlength="64" size="26" id="word"/><input type="hidden" value="upssntdnvelami" name="uc_param_str"/><input type="hidden" value="111041" name="st_1"/><input type="hidden" value="102041" name="st_2"/><input type="hidden" value="sz@1321_1004" name="pu"/><input type="hidden" name="idx" value="30000"/><input type="hidden" value="webmain" name="tn_1"/><input type="hidden" value="fwapadv" name="tn_2"/><input type="submit" value="百度一下" name="ct_1" class="bn"/></div></form><div class="a"><a href="http://wapwenku.baidu.com/?statcms=index_wenku&amp;ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;news?idx=30000&amp;itj=311">文库</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://m.baidu.com/img?idx=30000&amp;ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;itj=31">图片</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://wapiknow.baidu.com/?idx=30000&amp;ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;itj=34">知道</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://m.baidu.com/ssid=0/from=844b/bd_page_type=1/uid=ED33E3349E18F0B1DD42B0CE9649FE3B/pu=sz%401321_1004/news?idx=30000&amp;itj=32">新闻</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://wapbaike.baidu.com/?ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;itj=31">百科</a></div><div class="a"><a href="http://m.baidu.com/ssid=0/from=844b/bd_page_type=1/uid=ED33E3349E18F0B1DD42B0CE9649FE3B/pu=sz%401321_1004/app?idx=20000&amp;itj=325&amp;uc_param_str=ve">应用</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://wapmap.baidu.com/?ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;idx=30000&amp;itj=35">地图</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://wapp.baidu.com/?idx=30000&amp;ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;itj=33">贴吧</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://m.hao123.com/?ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;idx=30000&amp;itj=39">hao123</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://m.baidu.com/pub/u_more.php?idx=30000&amp;ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;itj=310&amp;device_os_id=2&amp;tj=utouch">更多</a></div><div class="d">下载:<a href="http://mo.baidu.com/baidusearch/android.php?&from=1612c&ref=mbsywl">百度搜索</a>&nbsp;&nbsp;<a href="http://m.baidu.com/from=1612c/app?action=content&amp;pid=825114773&amp;tj=825114773&amp;f=1612c">百度应用</a>&nbsp;&nbsp;<a href="http://mo.baidu.com/map/?from=1708">地图</a><div class="b"><a href="http://duokoo.baidu.com/novel/?fr=home&amp;ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp
      

  2.   

    晕,上面成一行了- -||
    <!DOCTYPE html PUBLIC "-//WAPFORUM//DTD XHTML Mobile 1.0//EN" "http://www.wapforum.org/DTD/xhtml-mobile10.dtd"><html xmlns="http://www.w3.org/1999/xhtml"><!--STATUS OK--><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8" /><meta http-equiv="Cache-control" content="no-cache" /><style type="text/css">body {text-align:center;line-height:120%}form {margin-top:10px;padding:5px}img {border:0}#b {background-color:#dfdfdf;padding:2px 1px 3px 1px}#word {width:72%;line-height:180%}.bn {width:24%;border:0;background-color:#dfdfdf;color:black;font-size:14px;padding-bottom:2px}.lg {margin-top:30px}a {text-decoration:none;color:#545164;font-size:14px}.a {margin-top:20px}.b {margin-top:10px;font-size:12px;color:#b4b4b4}.d {margin-top:50px;font-size:14px}.h {color:red}</style><title>百度一下,你就知道</title></head><body><div class="wrap"><div class="lg"><img src="http://m.baidu.com/static/index/i.gif" alt="百度首页" /></div><form action="http://m.baidu.com/ssid=0/from=844b/bd_page_type=1/uid=ED33E3349E18F0B1DD42B0CE9649FE3B/s" method="get"><div id="b"><input type="text" name="word" maxlength="64" size="26" id="word"/><input type="hidden" value="upssntdnvelami" name="uc_param_str"/><input type="hidden" value="111041" name="st_1"/><input type="hidden" value="102041" name="st_2"/><input type="hidden" value="sz@1321_1004" name="pu"/><input type="hidden" name="idx" value="30000"/><input type="hidden" value="webmain" name="tn_1"/><input type="hidden" value="fwapadv" name="tn_2"/><input type="submit" value="百度一下" name="ct_1" class="bn"/></div></form><div class="a"><a href="http://wapwenku.baidu.com/?statcms=index_wenku&amp;ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;news?idx=30000&amp;itj=311">文库</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://m.baidu.com/img?idx=30000&amp;ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;itj=31">图片</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://wapiknow.baidu.com/?idx=30000&amp;ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;itj=34">知道</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://m.baidu.com/ssid=0/from=844b/bd_page_type=1/uid=ED33E3349E18F0B1DD42B0CE9649FE3B/pu=sz%401321_1004/news?idx=30000&amp;itj=32">新闻</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://wapbaike.baidu.com/?ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;itj=31">百科</a></div><div class="a"><a href="http://m.baidu.com/ssid=0/from=844b/bd_page_type=1/uid=ED33E3349E18F0B1DD42B0CE9649FE3B/pu=sz%401321_1004/app?idx=20000&amp;itj=325&amp;uc_param_str=ve">应用</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://wapmap.baidu.com/?ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;idx=30000&amp;itj=35">地图</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://wapp.baidu.com/?idx=30000&amp;ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;itj=33">贴吧</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://m.hao123.com/?ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;idx=30000&amp;itj=39">hao123</a>&nbsp;&nbsp;&nbsp;&nbsp;<a href="http://m.baidu.com/pub/u_more.php?idx=30000&amp;ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp;pu=sz%401321_1004&amp;itj=310&amp;device_os_id=2&amp;tj=utouch">更多</a></div><div class="d">下载:<a href="http://mo.baidu.com/baidusearch/android.php?&from=1612c&ref=mbsywl">百度搜索</a>&nbsp;&nbsp;<a href="http://m.baidu.com/from=1612c/app?action=content&amp;pid=825114773&amp;tj=825114773&amp;f=1612c">百度应用</a>&nbsp;&nbsp;<a href="http://mo.baidu.com/map/?from=1708">地图</a><div class="b"><a href="http://duokoo.baidu.com/novel/?fr=home&amp;ssid=0&amp;from=844b&amp;bd_page_type=1&amp;uid=ED33E3349E18F0B1DD42B0CE9649FE3B&amp
      

  3.   

    感谢两位,原来是logcat长度限制问题,自己2了~