有html结构如下
<table ... id="main" ...>
<tbody>
<tr>
<td .....></td>
<td class="s_l">
<div><ol id="adlist_t">无关内容包含li标记</div>
<ol>
<li class="topsp">
<h3><a href="链接">文字</a></h3>
<p>无关内容</p>
<div class="result_summary">无关内容网页快照无关内容预览</div>
</li>
<li>
<h3><a href="链接">文字</a></h3>
<p>无关内容</p>
<div class="result_summary">无关内容网页快照无关内容预览</div>
</li>
<li>
<h3><a href="链接">文字</a></h3>
无关内容
</li>
<li>
<h3><a href="链接">文字</a></h3>
<p>无关内容</p>
<div class="result_summary">无关内容网页快照无关内容预览</div>
</li>
...
</ol>
<div><ol id="adlist_t">无关内容包含li标记</div>
</tr>
<tr>
...
</tr>
</tbody>
</table>我要得到的内容就是链接和文字(粗体显示),就是得到table(id为main)里ol(无id)里的<li>中<h3>中第一个(也只有一个)a标记的href和内容
有几个条件
1. 这个ol无id,而在其他div中还有些ol是有id的(如adlist_t),必须排除
2. 这个ol中有多个li,我要的li里必须还有一个div,class="result_summary",里面还有文字"网页快照"和"预览"
请参考
http://topic.csdn.net/u/20100429/10/b58fd37b-aa05-4f45-a418-5c908e823086.html
<table ... id="main" ...>
<tbody>
<tr>
<td .....></td>
<td class="s_l">
<div><ol id="adlist_t">无关内容包含li标记</div>
<ol>
<li class="topsp">
<h3><a href="链接">文字</a></h3>
<p>无关内容</p>
<div class="result_summary">无关内容网页快照无关内容预览</div>
</li>
<li>
<h3><a href="链接">文字</a></h3>
<p>无关内容</p>
<div class="result_summary">无关内容网页快照无关内容预览</div>
</li>
<li>
<h3><a href="链接">文字</a></h3>
无关内容
</li>
<li>
<h3><a href="链接">文字</a></h3>
<p>无关内容</p>
<div class="result_summary">无关内容网页快照无关内容预览</div>
</li>
...
</ol>
<div><ol id="adlist_t">无关内容包含li标记</div>
</tr>
<tr>
...
</tr>
</tbody>
</table>我要得到的内容就是链接和文字(粗体显示),就是得到table(id为main)里ol(无id)里的<li>中<h3>中第一个(也只有一个)a标记的href和内容
有几个条件
1. 这个ol无id,而在其他div中还有些ol是有id的(如adlist_t),必须排除
2. 这个ol中有多个li,我要的li里必须还有一个div,class="result_summary",里面还有文字"网页快照"和"预览"
请参考
http://topic.csdn.net/u/20100429/10/b58fd37b-aa05-4f45-a418-5c908e823086.html
解决方案 »
- 高分求替代ACCESS存储数据的方法。
- winform中的水晶报表导出PDF
- 如何遍历treeview最外层。如果text等于a就把该节点去掉?
- 无法将类型“string”隐式转换为“System.Windows.Forms.TextBox”
- VB6.0中的Command = "-B"在C#中怎么写
- iE浏览的时候网站一切正常,在本机调试的时候,树状列表显示不正常,只有一排排文字,没有树状效果.怎么回事啊?
- ******接了些开发项目,请人手,请高手帮忙!!*****
- WPF Combobox里面的选项是checkbox
- Windows的datagrid控件可以在web页面中引用吗?
- DataGridView为什么不自动显示,鼠标划过或点击后才显示,请看图
- 有没有word方面的专家,我想用open方法打开word后,改变了内容后,按菜单中的退出按钮时,不提示保存直接退出
- 怎么邮件不进垃圾邮箱?
2....
其他规则太复杂了。没时间写了……
HtmlDocument.GetElementById方式来做会容易一点点。
(?ix)<li[^>]*><h3><a\shref="(?<link>[^"]*)"[^>]*>(?<text>.*?)</a>
<em>股票</em>_搜搜百科
浦发银行(600000) _ <em>股票</em>行情 _ 东方财富网
<em>股票</em>首页_新浪财经_新浪网
和讯<em>股票</em>-访问量最大最专业的<em>股票</em>投资交流平台
<em>股票</em>行情中心_实时行情,行情数据_证券之星_比<em>股票</em>行情软件好用的网上...
证券之星-中国金融证券门户-<em>股票</em>-基金-股吧-行情-数据-外汇-期货
<em>股票</em>入门,炒股入门,<em>股票</em>知识,股市入门,如何炒股,炒股,入门吧
<em>股票</em>频道-全方位<em>股票</em>资讯平台-金融界
<em>股票</em>_证券之星_中国权威的<em>股票</em>资讯、<em>股票</em>投资交流平台
http://finance.qq.com/stock/
http://baike.soso.com/v49550.htm
http://quote.eastmoney.com/
http://finance.sina.com.cn/stock/
http://stock.hexun.com/
http://quote.stockstar.com/stock/
http://www.stockstar.com/home.htm
http://rumen8.com/
http://stock.jrj.com.cn/
http://stock.stockstar.com/