C#读取了一个网页,其中片段:
。
<div>
<ul>
<dt>a</dt>
<dd>a1</dd>
<dt>b</dt>
<dd>b1</dd>
<dt>c</dt>
<dd>c1</dd>
</ul>
</div>
如何通过正则表达式,获取以下片段?
<dt>a</dt>
<dd>a1</dd>
<dt>b</dt>
<dd>b1</dd>
。
<div>
<ul>
<dt>a</dt>
<dd>a1</dd>
<dt>b</dt>
<dd>b1</dd>
<dt>c</dt>
<dd>c1</dd>
</ul>
</div>
如何通过正则表达式,获取以下片段?
<dt>a</dt>
<dd>a1</dd>
<dt>b</dt>
<dd>b1</dd>
<(dt|dd)>(a1?|b1?)</(dt|dd)>
str = Regex.Match(str, @"(?is)(?<=<ul>)(\s*<(\w+)[^>]*>.*?</\2>){1,4}").Value;
(?<=<dt>(.*)</dt>(\\s*)<dd>)(.*)(?=</dd>)。