我想过滤html代码,然后实现只出现<p></P>标签,和保留<img />标签,有那位做过的朋友提供一个正则表达式或思路,在此谢过了,已经弄了好几天了,都没找到解决的办法,希望有做过的朋友帮忙一下,谢谢了,我没有多少分,谁要的话,就都给了吧,实话说,这个问题,我很急

解决方案 »

  1.   

    try...string result = Regex.Replace(yourStr, @"<(?!/?p|img)[^>]*>", "", RegexOptions.IgnoreCase);
      

  2.   

    如果我想把过滤出来的文本都放在<p></P>里,也就是把整个html代码过滤完后的文本都格式化成<p>文本</P>形式,有啥好的办法吗?
      

  3.   

    如果我想把过滤出来的文本都放在<p></P>里,也就是把整个html代码过滤完后的文本都格式化成<p>文本</P>形式,有啥好的办法吗?
      

  4.   

    你把你的要求说的再简单一点,写一个完整的HTML,然后写的你想要的东西。
      

  5.   

    http://news.163.com/08/1230/11/4UDKVM880001121M.html比如这个网页,我想把复制到的到html代码过滤,过滤后代码里只有<p></p>和<img />和文本,其中所有的文本的图片都放在<p></P>这中标签里面
      

  6.   


            protected void getsonpro(string sonpros, ArrayList href,ArrayList title)
            {
                if (sonpros.IndexOf("<a") != -1)
                {
                    sonpros = sonpros.Remove(0, sonpros.IndexOf("<a"));
                    string t_sonpros = sonpros.Substring(0, sonpros.IndexOf("</a>"));
                    if (t_sonpros.IndexOf("href=\"http://") != -1)
                    {
                        sonpros = sonpros.Remove(0, sonpros.IndexOf("href=\"http://"));
                        string _href = sonpros.Substring(sonpros.IndexOf("href=\"http://") + 13, sonpros.Substring(13).IndexOf("\""));
                        string _title = sonpros.Substring(sonpros.IndexOf(">") + 1, sonpros.IndexOf("</a>") - sonpros.IndexOf(">") - 1);
                        if (_href.IndexOf("daohang.google") == -1 && _href.Length < 80 && _title.Length<80 && !al1.Contains(_href) && !al2.Contains(_title))
                        {
                            href.Add(_href);
                            title.Add(_title);
                        }
                        sonpros = sonpros.Remove(0, sonpros.IndexOf("href=\"http://") + 13);
                        getsonpro(sonpros, href, title);
                    }
                    else if (t_sonpros.IndexOf("href='http://") != -1)
                    {
                        sonpros = sonpros.Remove(0, sonpros.IndexOf("href='http://"));
                        string _href = sonpros.Substring(sonpros.IndexOf("href='http://") + 13, sonpros.Substring(13).IndexOf("'"));
                        string _title = sonpros.Substring(sonpros.IndexOf(">") + 1, sonpros.IndexOf("</a>") - sonpros.IndexOf(">") - 1);
                        if (_href.IndexOf("daohang.google") == -1 && _href.Length < 80 && _title.Length < 80 && !al1.Contains(_href) && !al2.Contains(_title))
                        {
                            href.Add(_href);
                            title.Add(_title);
                        }
                        sonpros = sonpros.Remove(0, sonpros.IndexOf("href='http://") + 13);
                        getsonpro(sonpros, href, title);
                    }
                    else if (t_sonpros.IndexOf("href=http://") != -1)
                    {
                        sonpros = sonpros.Remove(0, sonpros.IndexOf("href=http://"));
                        string _href = sonpros.Substring(sonpros.IndexOf("href=http://") + 12, sonpros.Substring(12).IndexOf("/"));
                        string _title = sonpros.Substring(sonpros.IndexOf(">") + 1, sonpros.IndexOf("</a>") - sonpros.IndexOf(">") - 1);
                        if (_href.IndexOf("daohang.google") == -1 && _href.Length < 80 && _title.Length < 80 && !al1.Contains(_href) && !al2.Contains(_title))
                        {
                            href.Add(_href);
                            title.Add(_title);
                        }
                        sonpros = sonpros.Remove(0, sonpros.IndexOf("href=http://") + 12);
                        getsonpro(sonpros, href, title);
                    }
                    else
                    {
                        sonpros=sonpros.Remove(0, 2);
                        getsonpro(sonpros, href, title);
                    }
                }
            }
    这是N久前做的提取HTML代码中链接的HREF和TITLE的,希望对你有帮助
      

  7.   

    使用网络编辑超级工具箱软件里的格式化功能,这个软件的功能是网页中直接复制过来的文本,格式化一下,查看html源文件就可以全部转换成 <p> </p>形式的,我不知道是咋样实现的,又那位做过的朋友,提供一个思路,谢谢了,这是一个在线的快速格式化的http://www.aboutsoft.cn/fckeditor/,希望看过的朋友。明白的,请给一个思路或方法,非常谢谢,一直没找到好的思路