用JAVA写个GUI小程序。任务是输入一组关键词,程序会自动搜索百度。取出1000条url,然后把相同的url去掉。并下载为IE的.mht文件格式保存。大家来说说思路啊!谢过了哈!

解决方案 »

  1.   

    用机器人模拟。
    把你输入的内容自动填到baidu的搜索栏并模拟回车事件。
    最后就是一个比较的过程了
      

  2.   

    java.net.HttpURLConnection;
    java.net.URL;
    用socket来取页面。
      

  3.   

    思路:
    1、用java.net.HttpURLConnection,得到查询结果,也就是第一个页面。把页面中的关于结果的url找到并记录下来,再取第二页如此到1000个结果。
    2、过来1000个结果中的重复值
    3、针对每个URL,再用HttpURLConnection下载到主页面,再分析其中需要的链接,把需要的也搞下来。然后把这些下载的东西保存到.MHT
      

  4.   

    你需要知道mht格式的文件是如何编码的