请问alabaza:
我的想法就是用java的URL类把有关网页的源代码下载下来,然后用正则表达式提取其中的"<a href="http://......"部分,从而获得该网页的出链接.
如果像你说的那样,网页的源代码并不包含所有的出链接,那正则表达式怎么能提取到URL呢?
我的想法就是用java的URL类把有关网页的源代码下载下来,然后用正则表达式提取其中的"<a href="http://......"部分,从而获得该网页的出链接.
如果像你说的那样,网页的源代码并不包含所有的出链接,那正则表达式怎么能提取到URL呢?
解决方案 »
- 我是大四学生,请大家帮我把手中的学习资源排下序
- 请问,在linux下的程序中执行一个jar包文件,为什么我执行不了
- java聊天程序运行问题
- "AWT-EventQueue-0" java.lang.OutOfMemoryError: Java heap space
- 如何从Properties取的key value
- 怎样删除JFrame的标题栏咖啡杯图标?
- JAVA反射谁可以介绍一下?马上揭贴........
- 怎么把int值转化为String?
- ***********我有一个好主意*************
- 窗口可以存储成文件形式的吗
- 编码问题,如何获得指定字符串的编码?
- 请问一个java和c通讯时字节序的问题
private static Pattern pattern = Pattern.compile(expression,Pattern.CASE_INSENSITIVE);
Matcher m = pattern.matcher(content);
while(m.find()){ m.group(1).trim());}
匹配url.