一个赋有挑战性的JAVA问题哈!(网友们帮帮忙啊!谢了哈) 用JAVA写个GUI小程序。任务是输入一组关键词,程序会自动搜索百度。取出1000条url,然后把相同的url去掉。并下载为IE的.mht文件格式保存。大家来说说思路啊!谢过了哈! 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 用机器人模拟。把你输入的内容自动填到baidu的搜索栏并模拟回车事件。最后就是一个比较的过程了 java.net.HttpURLConnection;java.net.URL;用socket来取页面。 思路:1、用java.net.HttpURLConnection,得到查询结果,也就是第一个页面。把页面中的关于结果的url找到并记录下来,再取第二页如此到1000个结果。2、过来1000个结果中的重复值3、针对每个URL,再用HttpURLConnection下载到主页面,再分析其中需要的链接,把需要的也搞下来。然后把这些下载的东西保存到.MHT 你需要知道mht格式的文件是如何编码的 mysql中插入图片错误 想要做一个游戏…… 做网络爬虫遇到的问题 JAVA static 在web 中的作用 为何声明语句不能放在if()的后面? 如何实现JTable第一列不随滚动条滚动?? MySQl数据库中文乱码的问题,不是页面显示乱码的问题 java多个判断条件的实现! 关于Jtable的问题 请教一个问题 对于这个程序的加载顺序和输出顺序我不是很明白,劳烦解释一下。 一个在java中调用C的问题
把你输入的内容自动填到baidu的搜索栏并模拟回车事件。
最后就是一个比较的过程了
java.net.URL;
用socket来取页面。
1、用java.net.HttpURLConnection,得到查询结果,也就是第一个页面。把页面中的关于结果的url找到并记录下来,再取第二页如此到1000个结果。
2、过来1000个结果中的重复值
3、针对每个URL,再用HttpURLConnection下载到主页面,再分析其中需要的链接,把需要的也搞下来。然后把这些下载的东西保存到.MHT