<和>都被转义的。直接字符串搜索就可以了。不用正则。

解决方案 »

  1.   

    (?is)(?<=>)[^<]+(?=<)如待匹配<asdf>asdf a<asdf >   asdfasdf<asdf>
    匹配结果asdf a
       asdfasdf
      

  2.   

    MatchCollection mc = Regex.Matches(@"现在需要从HTML 页面中读取中文,我现在的解决方案是取 >文字<中间的字符,谁有更好的解决方案。还有谁知道 如何用正则判断 < > 吗?",@"(?<=^|>)((?![<>]).)+(?=<|$)");
    foreach(Match m in mc)
    {
        m.Value;//就是你要的
    }
      

  3.   

    Regex.Replace替换中文外字符为空
    剩下就是中文字符
      

  4.   

    1
    2
    匹配中文字符的正则表达式: [\u4e00-\u9fa5]
    3
    <>可以直接匹配html的<>
      

  5.   

    但是这种方式就会产生断章取义的情况
    <td>总共<font></font>页</td>
    取到的就是 “总共” “十” “页” 
    我们现在需求就是把网页中的中文,翻译成日文或韩文,这中方式取到的内容,无法翻译