假设有如下一段代码:
<div class="article">
这是无用内容
<b>这是无用内容</b>
这是有效文本
<img src=“a.jpg”/>
这是有效文本
<img src=“b.jpg”/>
这是有效文本
<img src=“c.jpg”/>
</div>
想用HtmlParser把所有有效文本都提取出来,不想一个一个慢慢提取,因为文本和IMG标签重复次数不确定。有智能一点的办法吗?多谢~~
可不可以定义提取</b>和</div>之间的内容··
<div class="article">
这是无用内容
<b>这是无用内容</b>
这是有效文本
<img src=“a.jpg”/>
这是有效文本
<img src=“b.jpg”/>
这是有效文本
<img src=“c.jpg”/>
</div>
想用HtmlParser把所有有效文本都提取出来,不想一个一个慢慢提取,因为文本和IMG标签重复次数不确定。有智能一点的办法吗?多谢~~
可不可以定义提取</b>和</div>之间的内容··
解决方案 »
- 按标签读取文本信息
- 今天在<CORE JAVA>上看到一个抽奖的小算法,与大家分享
- 不运行程序 看看你能猜出结果吗。为什么是这个结果?
- 我是新手,刚学JAVA,请大虾推荐本书````
- 关于import的初级问题,大家帮忙
- 大虾们来帮我解决一下
- 请问getImage("D:/weibolu/wei7.gif")与getImage("file:/D:/weibolu/wei7.gif")的区别
- 怎样在JDK的classpath中加入mysql的驱动???
- 请问?
- JDK目录下有bin、lib、jre文件夹,而其中的jre文件夹下又有bin、lib--------有什么不同啊________________________
- 如何实现下列程序的数组输出??
- groovyWS的new WSClient()问题
2.找出第一个<img符号,然后找出它前面的第一个</b> ,把内容取出来。
3.找出里面有多少个/>,再找出第一个/> 再找出这个符号的后一个<img。循环把内容取出来。
good luck.