目标文本是html标签,提取出标签名称,比如:<font size="+2" color="#800080"> 提取出font</font> 提取出/font小弟的代码是: //文本文件中内容是:<font size="+2" color="#800080">
string tagString = System.IO.File.ReadAllText("C:\\temp.txt");
string tagName = "";
Regex regTagName = new Regex("^<\\s*(?<tagName>\\w+)\\s*\\w*>$");
Match mTagName = regTagName.Match(tagString);
if (mTagName.Success)
{
tagName = mTagName.Groups["tagName"].Value;
MessageBox.Show(tagName);
}
else
{
MessageBox.Show("匹配失败");
return;
}小弟主要考虑的是html文本中有换行存在,但我的表达式匹配失败了,不知错在哪,求大家给一个可用的表达式,能满足我开头要求,能适应html文本换行情况。谢谢!
string tagString = System.IO.File.ReadAllText("C:\\temp.txt");
string tagName = "";
Regex regTagName = new Regex("^<\\s*(?<tagName>\\w+)\\s*\\w*>$");
Match mTagName = regTagName.Match(tagString);
if (mTagName.Success)
{
tagName = mTagName.Groups["tagName"].Value;
MessageBox.Show(tagName);
}
else
{
MessageBox.Show("匹配失败");
return;
}小弟主要考虑的是html文本中有换行存在,但我的表达式匹配失败了,不知错在哪,求大家给一个可用的表达式,能满足我开头要求,能适应html文本换行情况。谢谢!
"<\\s*(?<tagName>/?\\w+)"
(?<=</*\s*)[^ >]*