想在URL newUrl = new URL(strUrl)中的strUrl部分使用正则表达式,用来匹配网页名称,
比如网页名称中后几位是数字.html,这样的正则表达式怎么写呢?

解决方案 »

  1.   

    你可以先处理这个  strUrl .. 再去new 一个 url .. 
               处理的话..简单一点就用replaceAll().   你能举一个你的网页名称的例子么..这样好写一点.
      

  2.   

    就是想做一个新闻读取程序,想读对方网站上的新闻
    对方网站新闻页的html页面类似于"http://xinwen.com/newsname-12345.html"
    我想将类似这样的网页内容读取出来
    对方的网页命名规则通常是"新闻名称-新闻编号.html"
    这样的网页如何读取呢?
      

  3.   

    这个只是个参数,在使用前,先调用匹配的method,然后再用。
    每个方法做不同的事情,松耦合嘛~!
      

  4.   

    我觉得在URL中很难使用正则表达式的,strUrl需要表示一个具体的地址然后去建立连接。你现在是没有地址信息,而想通过URL来获取地址信息,也就是说你目前想把该类的输入作为输出,从设计上就不是合理的。我觉得你调研一下其他的技术比在这个上面花时间有意义的多,如通过网络爬虫或者连接提取工具获取到该网站的所有地址后,进行分析比较会更实际一点。
      

  5.   

    先处理strUrl,然后使用处理过的strUrl再去构造Url对象。
      

  6.   

    我觉得在URL中很难使用正则表达式的,strUrl需要表示一个具体的地址然后去建立连接。你现在是没有地址信息,而想通过URL来获取地址信息,也就是说你目前想把该类的输入作为输出,从设计上就不是合理的。 我觉得你调研一下其他的技术比在这个上面花时间有意义的多,如通过网络爬虫或者连接提取工具获取到该网站的所有地址后,进行分析比较会更实际一点。
      

  7.   

    先处理strUrl,然后使用处理过的strUrl再去构造Url对象。
      

  8.   

    同意三楼,如果实在要匹配 请看这贴的部分回复
    http://topic.csdn.net/u/20080911/12/b1d7b527-a855-4db3-a45f-7163ccd2f09f.html