现在我要做这样一件事:编写一个程序,希望通过我的程序能从其他人的网站上面提取有用的信息。
   比如现在有一个彩票网站,公布20选5的结果,而我希望通过我写的程序可以直接从彩票的网站上获取20选5的数据,而且要及时更新
   以我目前的水平,用java没一点头绪,希望大家可以提供一些思路,方法。在此先谢谢各位!!

解决方案 »

  1.   

    public static String sendGet(String url, String param) {
    String result  = "";
    String urlName = "";
    try {
    urlName = url +  param;
    URL U = new URL(urlName);
    URLConnection connection = U.openConnection();
    connection.connect(); BufferedReader in = new BufferedReader(new InputStreamReader(
    connection.getInputStream()));
    String line;
    while ((line = in.readLine()) != null) {
    result += line; 
    }
    in.close();
    } catch (Exception e) {
    System.out.println();
    System.out.println("与服务器连接发生异常错误  :" + e.toString());
    System.out.println("连接地址是  :"+urlName);
    }
    return result;
    }
      

  2.   

    <%@ page language="java" pageEncoding="UTF-8"%>
    <%@ page import="java.io.*,java.net.URL"%>
    <% 
     URL url = new URL("http://www.itpub.net");//建立URL对象,并实例化为url,获得要抓取的网页地址
     BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream(),"GB2312"));//建立BufferedReader对象,并实例化为reader,这里的GB2312是要抓取的网页编码格式
     while(reader.ready())
     {
      out.println(reader.readLine());
     }
     reader.close();
    %>URL url = new URL("http://www.itpub.net");//http://www.itpub.net就是你想抓的网页地址
    reader 对象就是读取到该网页的内容,下面是循环输出,你可以进行过滤找到你需要的内容,小偷程序其实就是远程读取文件 out.println(reader.readLine());
    这时你看到的网页内容实际上已经是你本机的代码了,而不是itpub上的主页了,图片显示不出来就是这个原因,现在就好办了,它的代码你都得到了,那么你想要什么东东就可以把它找出来了