抓取了一个网页,现在要截取字段
"<--开始-->内容<--结束-->"
public string HttpString_Filtrate(string Http_String, string Begin_String, string End_String)
{
int Begin_Int = Http_String.IndexOf(Begin_String);
int End_Int = Http_String.IndexOf(End_String);
string ReString = Http_String.Substring(End_Int,Begin_Int); return ReString;
}现在要得到内容,我写这个好象不行。。<--开始-->和<--结束-->为不固定值
"<--开始-->内容<--结束-->"
public string HttpString_Filtrate(string Http_String, string Begin_String, string End_String)
{
int Begin_Int = Http_String.IndexOf(Begin_String);
int End_Int = Http_String.IndexOf(End_String);
string ReString = Http_String.Substring(End_Int,Begin_Int); return ReString;
}现在要得到内容,我写这个好象不行。。<--开始-->和<--结束-->为不固定值
比如:"<hr>其它<--开始-->内容<br>内容<--结束-->其它<hr>"
得到"内容<br>内容"
那你想取哪部分HTML标识的内容 总知道吧?
然后用正则表达式代替Begin_String和End_String
<tr></tr>
</table>
怎么办?
<\\/\\1>", tag), "", RegexOptions.IgnoreCase); } return Regex.Replace(str, string.Format(@"(<{0}[^>]*(>)?)|(</{0}[^>]
*>)|", tag), "", RegexOptions.IgnoreCase); } // 删除字符串中的一组标记 //isContent:是否清除内容 public static string delTagArray(string str, string tagA, bool isContent) { string[] tagAa = tagA.Split(','); foreach (string sr1 in tagAa) //遍历所有标记,删除 { str = delTag(str, sr1, isContent); } return str; }
用正则该怎么表达,能达到同样效果吗?