抓取的源文件应该是这样<?xml version="1.0" encoding="utf-8"?>    
             
<!DOCTYPE wml PUBLIC "-//WAPFORUM//DTD WML 1.1//EN" "http://www.wapforum.org/DTD/wml_1.1.xml"> 
<wml>   
<head>
<meta forua="true" http-equiv="Cache-Control" content="max-age=0"/>
<meta http-equiv="Cache-Control" content="no-cache"/>
<meta name="Keywords" content="北京二手家具,北京二手家具,北京二手家具转让,北京二手家具求购,二手家具转让" />
<meta name="Description" content="58同城网分类北京家具信息网为你提供大量精选北京家居,家具,家饰,北京二手家具转让等信息。二手家居信息:便宜转让可议搬家自用家具转让本人急出售高低衣柜、布艺床" />
</head>
<card  id="start" title="北京二手家具转让/求购-58同城网北京二手家具市场">
<p>
<img alt="58同城" src="/images/logo.gif"/><br/>
找<input name="key5377"  type="text" value="" size="10"/>物品<anchor>[搜]<go href="/bj_s/;jsessionid=aO-SjvNNjGrf" method="post"><postfield name="keyword" value="$(key5377)" /><postfield name="type" value="jujia" /></go></anchor>
<br/>
全部 <a href="/bj_jujia_t0b0_1/">转让</a> <a href="/bj_jujia_t1b0_1/">求购</a> <br/>
<a href="/bj_jujia_tb_1/">全部</a> 个人 <a href="/bj_jujia_tb1_1/">商家</a> <br/>
-------------<br/> 
  
<a href="/bj_jujia/25243165.html">550元/便宜转让{{环保家具和</a><br/>
  
<a href="/bj_jujia/25241276.html">搬家自用家具转让</a><br/>
  
<a href="/bj_jujia/25237242.html">150元/本人急出售高低衣柜、</a><br/>
  
<a href="/bj_jujia/25138271.html">北京茶枕头 团购茶枕 优惠多</a><br/>
  
<a href="/bj_jujia/21643216.html">200元/出售闲置鱼缸</a><br/>
  
<a href="/bj_jujia/25235993.html">北京折叠床/沙发床/上下床/双</a><br/>
  
<a href="/bj_jujia/25235872.html">70元/个人处理闲置九新家具,</a><br/>
  
<a href="/bj_jujia/25235722.html">北京折叠床/沙发床/上下床/双</a><br/>
  
<a href="/bj_jujia/25233773.html">北京天雨旧房拆除/楼板楼梯开</a><br/>
  
<a href="/bj_jujia/25233169.html">求购/标准大煤气罐</a><br/>
  
<a href="/bj_jujia/25226110.html">急转自用家具,白枫色双人床,</a><br/>
  
<a href="/bj_jujia/25222275.html">第五届中国(北京)国际制冷、</a><br/>
  
<a href="/bj_jujia/25221745.html">转让一套高档时尚白枫色家具</a><br/>
  
<a href="/bj_jujia/25219608.html">1300元/转让/出售二手家具</a><br/>
  
<a href="/bj_jujia/25219450.html">钢质平卧式防火卷帘钢质侧向</a><br/>
  
<a href="/bj_jujia/25218119.html">急转时尚环保家具,款式新颖,</a><br/>
  
<a href="/bj_jujia/25216807.html">105元/“折叠生活床上笔记本</a><br/>
  
<a href="/bj_jujia/25216059.html">1元/搬家急转,有你需要吗</a><br/>
  
<a href="/bj_jujia/25214352.html">550元/处理自用的[家具和电器</a><br/>
  
<a href="/bj_jujia/25214244.html">1元/急转家具.电器(中介勿扰)</a><br/>
  <a href="/bj_jujia_tb0_2/">下一页</a> 1<a href="/bj_jujia_tb0_2/">2</a><a href="/bj_jujia_tb0_3/">3</a><a href="/bj_jujia_tb0_4/">4</a><a href="/bj_jujia_tb0_5/">5</a><a href="/bj_jujia_tb0_6/">6</a><a href="/bj_jujia_tb0_7/">7</a><a href="/bj_jujia_tb0_8/">...</a> <br/><a href="/bj/send_sale/">发布一条</a><br/>
<a href="/bj/">58同城</a>&gt;<a href="/bj_sale/">跳蚤市场</a>&gt;<a href="/bj_jujia/">家具/家居/家饰</a><br/>
[相关类别]<br/><a href="/bj_diannao/">二手电脑/配件</a> <a href="/bj_pet/">花鸟鱼虫</a> <a href="/bj_piao/">门票/体育赛事</a> <a href="/bj_huochepiao/">火车票</a> <a href="/bj_yanchu/">演出门票</a> <a href="/bj_danche/">二手摩托车</a> <a href="/bj_ershoushebei/">二手设备</a> <a href="/bj_tushu/">图书/音像/软件</a> <a href="/bj_kaquan/">优惠卡/消费券/健身卡</a> <a href="/bj_wangyou/">网游/虚拟物品</a> <br/>
[热门城市]<br/><a href="/bj_jujia/">北京家具/家居/家饰</a> <a href="/gz_jujia/">广州家具/家居/家饰</a> <a href="/sz_jujia/">深圳家具/家居/家饰</a> <a href="/sh_jujia/">上海家具/家居/家饰</a> <a href="/jujia/map.html">全国家具/家居/家饰</a><br/>
书签:wap.58.com/bj<br/>报时:12:21 
</p> 
</card>
</wml>

解决方案 »

  1.   

    但实际抓取的为
    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
    <html xmlns="http://www.w3.org/1999/xhtml">
    <head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
    <title>58同城-领先的分类信息网站-免费查询发布各类生活信息</title>
    <meta name="description" content="免费发布信息,查询分类广告,租房合租信息,招聘兼职,二手转让,征婚交友,家政保姆,拼车拼游,买卖转让二手家电,电脑,手机,票务等相关个人生活信息,尽在58同城网。">
    <meta name="keywords" content="58同城分类信息网站">
    <link type="text/css" rel="stylesheet" href="http://pic2.58.com/css/4_0/base.css"/>
    <link type="text/css" rel="stylesheet" href="http://pic2.58.com/css/4_0/city.css">
    <script src="http://pic2.58.com/js/index/3_0/index.js"></script>
    </head>
    <body>
    <div id="top" class="ulLink mw">
      <div id="topLogo"><a href="/"><img src="http://pic2.58.com/images/logo.gif" alt="58同城-便民互助信息网站" border="0" /></a></div>
    </div>
    <div class="mw">
      <div id="cityWel">
        
    <h2><a href="/house.aspx">房屋</a>、<a href="/sale.aspx">二手</a>、<a href="/jiaoyou.aspx">交友</a>、<a href="/jianzhi.aspx">兼职</a>、<a href="/job.aspx">招聘</a>、<a href="/car.aspx">车辆</a>、<a href="/life.aspx">活动</a>、<a href="/yellowpage.aspx">黄页</a>…免费发布!</h2>
    <p class="fGrey2">58同城是最活跃的中文分类信息网站,在这里你可以浏览或发布租房、交友、买卖物品、找工作以及寻求合作等信息。发布分类广告,查询生活信息,完全免费!58-我发布、我发现。</p>    <a href="http://gz.58.com/" class="butCity" onclick="SetCookies('gz')">进入58同城广州站</a> </div>
    </div>
    <div class="spacer8"></div>
    <div class="cityNav mw"> &nbsp;或者按城市首字母顺序选择要访问的本地信息站点:
      <div class="c"></div>
      <div class="spacer8"></div>
    </div>
    <div id="b_box" class="mw">
      <div class="cityBor">
        <div class="spacer8"></div>
     
        <li><a href="http://cd.58.com/" class="fRed" onclick="SetCookies('cd')">成都</a></li>
        <li><a href="http://cs.58.com/" class="fRed" onclick="SetCookies('cs')">长沙</a></li>
        <li><a href="http://cq.58.com/" onclick="SetCookies('cq')">重庆</a></li>
        <li><a href="http://cc.58.com/" onclick="SetCookies('cc')">长春</a></li>
        <li><a href="http://cz.58.com/" onclick="SetCookies('cz')">常州</a></li>
        <li><a href="http://cangzhou.58.com/" onclick="SetCookies('cangzhou')">沧州</a></li>
        <li><a href="http://changde.58.com/" onclick="SetCookies('changde')">常德</a></li>
        <li><a href="http://chenzhou.58.com/" onclick="SetCookies('chenzhou')">郴州</a></li>
        <li><a href="http://chifeng.58.com/" onclick="SetCookies('chifeng')">赤峰</a></li>
    <li><a href="http://chengde.58.com/" onclick="SetCookies('chengde')">承德</a></li>
    <li><a href="http://changzhi.58.com/" onclick="SetCookies('changzhi')">长治</a></li>
      </ul>
    </div>
    <div class="city_l">
      <ul class="city_ul">
     
        <li><a href="http://fz.58.com/" onclick="SetCookies('fz')">福州</a></li>
        <li><a href="http://fs.58.com/" onclick="SetCookies('fs')">佛山</a></li>
        <li><a href="http://fushun.58.com/" onclick="SetCookies('fushun')">抚顺</a></li>
      </ul>
      <ul class="city_ul">
        <li class="abc">G</li>
        <li><a href="http://gz.58.com/" class="fRed" onclick="SetCookies('gz')">广州</a></li>
        <li><a href="http://gy.58.com/" onclick="SetCookies('gy')">贵阳</a></li>
        <li><a href="http://gl.58.com/" onclick="SetCookies('gl')">桂林</a></li>
    <li><a href="http://gg.58.com/" onclick="SetCookies('gg')">贵港</a></li>
      </ul>
    </div>
    <div class="city_l">
      <ul class="city_ul">
        <li class="abc">H</li>
        <li><a href="http://hz.58.com/" class="fRed" onclick="SetCookies('hz')">杭州</a></li>
        <li><a href="http://hrb.58.com/" onclick="SetCookies('hrb')">哈尔滨</a></li>
        <li><a href="http://haikou.58.com/" onclick="SetCookies('haikou')">海口</a></li>
        <li><a href="http://hf.58.com/" onclick="SetCookies('hf')">合肥</a></li>
        <li class="city_4"><a href="http://hu.58.com/" onclick="SetCookies('hu')">呼和浩特</a></li>
        <li><a href="http://huizhou.58.com/" onclick="SetCookies('huizhou')">惠州</a></li>
        <li><a href="http://hy.58.com/" onclick="SetCookies('hy')">衡阳</a></li>
        <li><a href="http://hd.58.com/" onclick="SetCookies('hd')">邯郸</a></li>
        <li><a href="http://huzhou.58.com/" onclick="SetCookies('huzhou')">湖州</a></li>
         <li class="abc">K</li>
     ('lasa')">拉萨</a></li>
        <li><a href="http://linfen.58.com/" onclick="SetCookies('linfen')">临汾</a></li>
    <li><a href="http://ly.58.com/" onclick="SetCookies('ly')">龙岩</a></li>
      </ul>
    </div>
    <div class="city_l">
      <ul class="city_ul">
        <li class="abc">M</li>
        <li><a href="http://mianyang.58.com/" onclick="SetCookies('mianyang')">绵阳</a></li>
        <li><a href="http://mm.58.com/" onclick="SetCookies('mm')">茂名</a></li>
        <li><a href="http://mas.58.com/" onclick="SetCookies('mas')">马鞍山</a></li>
    <li><a href="http://mdj.58.com/" onclick="SetCookies('mdj')">牡丹江</a></li>
      </ul>
      <ul class="city_ul">
        <">与58对话</a></p>
    </div>
    <script src="http://www.google-analytics.com/urchin.js" type="text/javascript"> </script>
    <script type="text/javascript"> _uacct = "UA-877409-4"; urchinTracker(); 
    </script>
    </body>
    </html>
      

  2.   

    http://wap.58.com/bj_jujia打开用 opera浏览器
      

  3.   

    System.Net.WebRequest request = System.Net.WebRequest.Create(url); 
    这个说明你是用http协议去请求的
    那你抓到的肯定是html的页面额
      

  4.   

    好像你的程序只能抓取html文件。
      

  5.   

    就是这个wap网站会根据你的请求返回不同的输出。主要是httphead中的contenttype。
    wal的是:Content-type: text/vnd.wap.wml你修改httpwebreuqest对象的 contentType字段为:text/vnd.wap.wml即可。
      

  6.   

    WAP 不能为 Windows 的识别的的, 那个东西 不是HTML ,好不是无线协议中的。
      

  7.   

    它是 wml 文件,不是 HTML 只有只能手机上或是 wap 的站点有对应的 html 智能机那种,你能得到 html,精简的 就是 wml 。
      

  8.   


                HttpWebRequest oplrequest = (HttpWebRequest)WebRequest.Create(网址);
                oplrequest.Accept = "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8";
                oplrequest.ContentType = "application/x-www-form-urlencoded";
                oplrequest.UserAgent = "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)";
                oplrequest.Method = "GET";
                oplrequest.KeepAlive = true;
                oplrequest.CookieContainer = new CookieContainer();
                oplrequest.AllowAutoRedirect = true;
                oplrequest.CookieContainer = cookiecont;            HttpWebResponse oplresponse = (HttpWebResponse)oplrequest.GetResponse();
                Stream oplresstream = oplresponse.GetResponseStream();
                StreamReader oplsr = new StreamReader(oplresstream, Encoding.GetEncoding("utf-8"));
                string oplHTML = oplsr.ReadToEnd();
                oplresstream.Close();
                oplsr.Close();
                oplresponse.Close();试试这个