我是通過JAVA來抓取到的網頁源代碼.現在我需要提取其中的一部分.所以需要用正則表達式過濾,我是用java.util.regex.Matcher和java.util.regex.Pattern.現在我抓取過來的網頁源代碼中<A HREF="../detail.asp?main_id=186236">這里是需要抓取的內容</A>.我的正則表達式為<A HREF=.*main_id=.*>(.*.)</A>
因為源代碼中的內容有的全面有換行,有的中間有換行,有的後面有換行.如果都沒有換行的話我的正則表達式能正確獲得,請問正則表達式如何寫才能抓取到所有情況呢?就是有換行的情況也能抓取到?
因為源代碼中的內容有的全面有換行,有的中間有換行,有的後面有換行.如果都沒有換行的話我的正則表達式能正確獲得,請問正則表達式如何寫才能抓取到所有情況呢?就是有換行的情況也能抓取到?
解决方案 »
- 多线程
- spring(2.5)和struts2(2.0.14)集成问题!跪求高手指教!
- JAVA熟练
- JTable 有没有能实现合并单元格??
- 关于广域网的访问!!!
- 强积金
- 还要问一次关于helloworld的问题
- 如何解决JTextPane中打开行数超过3000行的文本就很慢的问题
- 初学者的问题:在JDK中编译含action()方法的出现错误,浏览器中显示空白。下面附上源码和错误:
- android新浪oauth验证错误
- 请大家帮帮我!Exception in thread "main" java.lang.NoClassDefFoundError :TFMath
- 在ToolBar左右加上两个箭头按钮,点击箭头按钮,可以使ToolBar左右移动 , 希望有源代码. (高分求!!!)
正則表達式:<A HREF=.*main_id=.*>([^<]*)</A>
Pattern p=Pattern.compile("<A HREF=.*main_id=.*>([^<]*)</A>",Pattern.MULTILINE);
Pattern.MULTILINE指定多行模式.
如果高人有更好的處理方式,謝謝告知.
謝謝幫頂的朋友.