请问大家一下呵,现在要提取网页中图片周围的文本,我的思路是先把HTML网页转换成XML文档,然后利用DOM解析提取XML文档中所需要的信息?
这个思路对吗?
谢谢呵呵