实现机票查询功能,但客户未提供接口,说可以从某网站得到数据,怎么实现,是盗用数据还是什么?大家帮忙讨论一下!

解决方案 »

  1.   

    用HttpWebRequest去抓取网页,然后根据 html找到相应的数据.
      

  2.   

    我现在不知道如何根据我的需要(根据参数)抓取,好象那个网站是post提交的吧,是JSP的。
      

  3.   

    这里有个例子
    http://www.113317.com/blog/article.asp?id=546
      

  4.   

    不知有沒有webservice?頂
    結帖時接點分....
      

  5.   

    楼上那位兄弟你那个例子我打不开啊!
    我把那个网站发出来大家帮我看看怎么用它的数据
    http://www.yoee.com/
      

  6.   

    HttpWebRequest 是 .net 基类库中的一个类,在命名空间 System.Net 下面,用来使用户通过 HTTP 协议和服务器交互。 HttpWebRequest 对 HTTP 协议进行了完整的封装,对 HTTP 协议中的 Header, Content, Cookie 都做了属性和方法的支持,很容易就能编写出一个模拟浏览器自动登录的程序。 程序使用 HTTP 协议和服务器交互主要是进行数据的提交,通常数据的提交是通过 GET 和 POST 两种方式来完成,下面对这两种方式进行一下说明: 1. GET 方式。 GET 方式通过在网络地址附加参数来完成数据的提交,比如在地址 http://www.google.com/webhp?hl=zh-CN 中,前面部分 http://www.google.com/webhp 表示数据提交的网址,后面部分 hl=zh-CN 表示附加的参数,其中 hl 表示一个键(key), zh-CN 表示这个键对应的值(value)。程序代码如下: HttpWebRequest req = (HttpWebRequest) HttpWebRequest.Create( "http://www.google.com/webhp?hl=zh-CN" );
    req.Method = "GET";
    using (WebResponse wr = req.GetResponse())
    {
       //在这里对接收到的页面内容进行处理
    } 2. POST 方式。 POST 方式通过在页面内容中填写参数的方法来完成数据的提交,参数的格式和 GET 方式一样,是类似于 hl=zh-CN&newwindow=1 这样的结构。程序代码如下: string param = "hl=zh-CN&newwindow=1";
    byte[] bs = Encoding.ASCII.GetBytes(param);HttpWebRequest req = (HttpWebRequest) HttpWebRequest.Create( "http://www.google.com/intl/zh-CN/" );
    req.Method = "POST";
    req.ContentType = "application/x-www-form-urlencoded";
    req.ContentLength = bs.Length;using (Stream reqStream = req.GetRequestStream())
    {
       reqStream.Write(bs, 0, bs.Length);
    }
    using (WebResponse wr = req.GetResponse())
    {
       //在这里对接收到的页面内容进行处理
    } 在上面的代码中,我们访问了 www.google.com 的网址,分别以 GET 和 POST 方式提交了数据,并接收了返回的页面内容。然而,如果提交的参数中含有中文,那么这样的处理是不够的,需要对其进行编码,让对方网站能够识别。 3. 使用 GET 方式提交中文数据。 GET 方式通过在网络地址中附加参数来完成数据提交,对于中文的编码,常用的有 gb2312 和 utf8 两种,用 gb2312 方式编码访问的程序代码如下: Encoding myEncoding = Encoding.GetEncoding("gb2312");
    string address = "http://www.baidu.com/s?" + HttpUtility.UrlEncode("参数一", myEncoding) + "=" + HttpUtility.UrlEncode("值一", myEncoding);
    HttpWebRequest req = (HttpWebRequest)HttpWebRequest.Create(address);
    req.Method = "GET";
    using (WebResponse wr = req.GetResponse())
    {
       //在这里对接收到的页面内容进行处理
    } 在上面的程序代码中,我们以 GET 方式访问了网址 http://www.baidu.com/s ,传递了参数“参数一=值一”,由于无法告知对方提交数据的编码类型,所以编码方式要以对方的网站为标准。常见的网站中, www.baidu.com (百度)的编码方式是 gb2312, www.google.com (谷歌)的编码方式是 utf8。 4. 使用 POST 方式提交中文数据。 POST 方式通过在页面内容中填写参数的方法来完成数据的提交,由于提交的参数中可以说明使用的编码方式,所以理论上能获得更大的兼容性。用 gb2312 方式编码访问的程序代码如下: Encoding myEncoding = Encoding.GetEncoding("gb2312");
    string param = HttpUtility.UrlEncode("参数一", myEncoding) + "=" + HttpUtility.UrlEncode("值一", myEncoding) + "&" + HttpUtility.UrlEncode("参数二", myEncoding) + "=" + HttpUtility.UrlEncode("值二", myEncoding);byte[] postBytes = Encoding.ASCII.GetBytes(param);HttpWebRequest req = (HttpWebRequest) HttpWebRequest.Create( "http://www.baidu.com/s" );
    req.Method = "POST";
    req.ContentType = "application/x-www-form-urlencoded;charset=gb2312";
    req.ContentLength = postBytes.Length;using (Stream reqStream = req.GetRequestStream())
    {
       reqStream.Write(bs, 0, bs.Length);
    }
    using (WebResponse wr = req.GetResponse())
    {
       //在这里对接收到的页面内容进行处理
    } 从上面的代码可以看出, POST 中文数据的时候,先使用 UrlEncode 方法将中文字符转换为编码后的 ASCII 码,然后提交到服务器,提交的时候可以说明编码的方式,用来使对方服务器能够正确的解析。 以上列出了客户端程序使用 HTTP 协议与服务器交互的情况,常用的是 GET 和 POST 方式。现在流行的 WebService 也是通过 HTTP 协议来交互的,使用的是 POST 方法。与以上稍有所不同的是, WebService 提交的数据内容和接收到的数据内容都是使用了 XML 方式编码。所以, HttpWebRequest 也可以使用在调用 WebService 的情况下。 
      

  7.   

    如果是在后台跳转的
    req.AllowAutoRedirect = true就会自动跳转.如果用javascript跳转的,再手动请求新的页面.
      

  8.   

    我的意思是我要抓取的页面要使用跳转页才能跳到数据页,怎么办?这个好象就是为了防址盗用数据!
    就是这个网站http://www.yoee.com/
    机票查讯那个数据,头都大了!
      

  9.   

    就算抓过来也订不了票,我这里有可以调用的webservices ,实时查询,实时预定,实时出票,实时删除PNR记录,发送行程单短信等如果需要可联系,QQ395712970
      

  10.   

    http://et.kxun.cn/webservices/eas_ws_com.asmx