1,解析该页面,提取其上所有url地址(用javax.swing.text.html包和javax.swing.text.html.parser包,主要用ParserDelegator和HTMLEditorKit.ParserCallback类)。
2,用java.net包下的东东读每一个url的内容
如:new URL(url).getInputStream()看一下这些东东吧,很容易的。