source:<table width="100%"><tbody><tr>
<td>
<div id="NormalPosts">
<a id="HotPosts1_RecentPostsRepeater__ctl1_HyperLink2" title="<img src="/images/authorship.gif" border="0" width="15" height="13" />&Danny Thorpe 到微软工作了" href="http://blog.csdn.net/dogbear2000/archive/2006/04/15/664478.aspx"><img src="/images/authorship.gif" border="0" height="13" width="15"> Danny Thorpe 到微软工作了</a></div>
</td>
<td>
15日
</td>
<td>
<div class="Author">
<a id="HotPosts1_RecentPostsRepeater__ctl1_Hyperlink1" class="clsSubText" title="dogbear2000" href="http://blog.csdn.net/dogbear2000/">dogbear2000</a>
</div></td><td align="right">
<a id="HotPosts1_RecentPostsRepeater__ctl1_Hyperlink6" href="http://blog.csdn.net/dogbear2000/posts/664478.aspx#FeedBack">17/9672</a>
</td>
</tr><tr>
<td>
<div id="NormalPosts"><a id="HotPosts1_RecentPostsRepeater__ctl2_HyperLink2" title="<img src="/images/authorship.gif" border="0" width="15" height="13" />&windows与unix体系结构图" href="http://blog.csdn.net/byxdaz/archive/2006/04/15/664543.aspx"><img src="/images/authorship.gif" border="0" height="13" width="15"> windows与unix体系结构图</a>
</div>
</td>
<td>
15日
</td>
<td>
<div class="Author">
<a id="HotPosts1_RecentPostsRepeater__ctl2_Hyperlink1" class="clsSubText" title="byxdaz" href="http://blog.csdn.net/byxdaz/">byxdaz</a></div>
</td><td align="right">
<a id="HotPosts1_RecentPostsRepeater__ctl2_Hyperlink6" href="http://blog.csdn.net/byxdaz/posts/664543.aspx#FeedBack">8/4230</a>
</td>
</tr><tr>
<td><div id="NormalPosts">
<a id="HotPosts1_RecentPostsRepeater__ctl3_HyperLink2" title="<img src="/images/authorship.gif" border="0" width="15" height="13" />&.net开发趣题两则-联想优秀程序员与专业程序员(downmoon)" href="http://blog.csdn.net/downmoon/archive/2006/04/13/661830.aspx"><img src="/images/authorship.gif" border="0" height="13" width="15"> .net开发趣题两则-联想优秀程序员与专业程序员(downmoon)</a>
</div>
</td>
<td>
13日
</td>
<td>
<div class="Author"><a id="HotPosts1_RecentPostsRepeater__ctl3_Hyperlink1" class="clsSubText" title="downmoon" href="http://blog.csdn.net/downmoon/">downmoon</a>
</div>
</td><td align="right">
<a id="HotPosts1_RecentPostsRepeater__ctl3_Hyperlink6" href="http://blog.csdn.net/downmoon/posts/661830.aspx#FeedBack">34/3710</a>
</td>
</tr><tr><td>
<div id="NormalPosts">
<a id="HotPosts1_RecentPostsRepeater__ctl4_HyperLink2" title="<img src="/images/authorship.gif" border="0" width="15" height="13" />&八荣八耻" href="http://blog.csdn.net/leavecd/archive/2006/04/12/661063.aspx"><img src="/images/authorship.gif" border="0" height="13" width="15"> 八荣八耻</a>
</div>
</td>
<td>
12日
</td>
<td><div class="Author">
<a id="HotPosts1_RecentPostsRepeater__ctl4_Hyperlink1" class="clsSubText" title="leavecd" href="http://blog.csdn.net/leavecd/">leavecd</a>
</div>
</td><td align="right">
<a id="HotPosts1_RecentPostsRepeater__ctl4_Hyperlink6" href="http://blog.csdn.net/leavecd/posts/661063.aspx#FeedBack">2/3446</a>
</td>
</tr>
<tr>
<td>
<div id="NormalPosts">
<a id="HotPosts1_RecentPostsRepeater__ctl5_HyperLink2" title="<img src="/images/authorship.gif" border="0" width="15" height="13" />&如何编写异常安全的C++代码" href="http://blog.csdn.net/wingfiring/archive/2006/04/12/660900.aspx"><img src="/images/authorship.gif" border="0" height="13" width="15"> 如何编写异常安全的C++代码</a>
</div>
</td>
<td>
12日
</td><td>
<div class="Author">
<a id="HotPosts1_RecentPostsRepeater__ctl5_Hyperlink1" class="clsSubText" title="非典型秃子" href="http://blog.csdn.net/wingfiring/">非典型秃子</a>
</div>
</td><td align="right">
<a id="HotPosts1_RecentPostsRepeater__ctl5_Hyperlink6" href="http://blog.csdn.net/wingfiring/posts/660900.aspx#FeedBack">13/2832</a>
</td></tr>
</tbody></table>pattern:
<tr>{*}<td>{*}<div id="NormalPosts">{*}href="{%}"<img src{*}>{%}</a>我可以通过这个pattern去取source中对应{%}的内容, {*}表示忽略任何内容.可以解析到:
http://blog.csdn.net/dogbear2000/archive/2006/04/15/664478.aspx Danny Thorpe 到微软工作了http://blog.csdn.net/byxdaz/archive/2006/04/15/664543.aspx windows与unix体系结构图http://blog.csdn.net/downmoon/archive/2006/04/13/661830.aspx .net开发趣题两则-联想优秀程序员与专业程序员(downmoon)http://blog.csdn.net/leavecd/archive/2006/04/12/661063.aspx 八荣八耻http://blog.csdn.net/wingfiring/archive/2006/04/12/660900.aspx 如何编写异常安全的C++代码谢谢

解决方案 »

  1.   

    String strSource = ".............";
     Matcher m = Pattern.compile("<tr>{*}<td>{*}<div id="NormalPosts">{*}href="{%}"<img src{*}>{%}</a>").matcher(strSource );
     while (matcher.find()) { 
      String group=matcher.group(); 
       System.out.println(group) ;
     } 
      

  2.   

    strSource 就是你的待解析内容
      

  3.   

    laughsmile(海边的星空)你是说正则表达式么, 你觉得Pattern.compile("<tr>{*}<td>{*}<div id="NormalPosts">{*}href="{%}"<img src{*}>{%}</a>")这个能通过么. 这个不是规范的呀. 而且就算这个是规范的. 你打印出来的也是所有包括的文字. 我需要的是{%}里面的内容呀. 一个List 里面的每个item是一个Sting[] 如{"http://blog.csdn.net/dogbear2000/archive/2006/04/15/664478.aspx", "Danny Thorpe 到微软工作了"},  List的size就等于table tr的数量.
      

  4.   

    没有测试过,我以为你把pattern已经知道了,只是想知道使用方法.
    不过,要实现你的这个目的只有通过正则表达式.