html中的标签重复,
如在一个页面里面代码是这样的
<html>
<body>
<title>标题1</tilte>
<div id=content>内容1</div>
<title>标题2</tilte>
<div id=content>内容2</div>
<title>标题3</tilte>
<div id=content>内容3</div>
<title>标题4</tilte>
<div id=content>内容4</div>
<title>标题5</tilte>
<div id=content>内容5</div>
<title>标题6</tilte>
<div id=content>内容6</div>
想要提取标题和内容,每个标题和对应的内容生成一个word
这里有个模型文件和要处理的文件
http://1c42c.tb.ipc.la/模型.rar