小弟手里有这样一个文本文件:
1 02 
http://news.xinhuanet.com/edu/2006-03/08/content_4276043.htm
<html>
网页代码
</html>2 08 
http://news.xinhuanet.com/edu/2006-03/08/content_4276043.htm
<html>
网页代码
</html>.
.
.
.
一共有1000多个这样的段落我想把每个段落<html></html>以及中间的内容去掉,只保留类似
2 08 
http://news.xinhuanet.com/edu/2006-03/08/content_4276043.htm
这两行,想了很长时间也没想出来该怎么弄,请各位高手帮帮忙,小弟先谢了