求一个正则或一个思路,关于html代码过滤的问题 我想过滤html代码,然后实现只出现<p></P>标签,和保留<img />标签,有那位做过的朋友提供一个正则表达式或思路,在此谢过了,已经弄了好几天了,都没找到解决的办法,希望有做过的朋友帮忙一下,谢谢了,我没有多少分,谁要的话,就都给了吧,实话说,这个问题,我很急 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 try...string result = Regex.Replace(yourStr, @"<(?!/?p|img)[^>]*>", "", RegexOptions.IgnoreCase); 如果我想把过滤出来的文本都放在<p></P>里,也就是把整个html代码过滤完后的文本都格式化成<p>文本</P>形式,有啥好的办法吗? 如果我想把过滤出来的文本都放在<p></P>里,也就是把整个html代码过滤完后的文本都格式化成<p>文本</P>形式,有啥好的办法吗? 你把你的要求说的再简单一点,写一个完整的HTML,然后写的你想要的东西。 http://news.163.com/08/1230/11/4UDKVM880001121M.html比如这个网页,我想把复制到的到html代码过滤,过滤后代码里只有<p></p>和<img />和文本,其中所有的文本的图片都放在<p></P>这中标签里面 protected void getsonpro(string sonpros, ArrayList href,ArrayList title) { if (sonpros.IndexOf("<a") != -1) { sonpros = sonpros.Remove(0, sonpros.IndexOf("<a")); string t_sonpros = sonpros.Substring(0, sonpros.IndexOf("</a>")); if (t_sonpros.IndexOf("href=\"http://") != -1) { sonpros = sonpros.Remove(0, sonpros.IndexOf("href=\"http://")); string _href = sonpros.Substring(sonpros.IndexOf("href=\"http://") + 13, sonpros.Substring(13).IndexOf("\"")); string _title = sonpros.Substring(sonpros.IndexOf(">") + 1, sonpros.IndexOf("</a>") - sonpros.IndexOf(">") - 1); if (_href.IndexOf("daohang.google") == -1 && _href.Length < 80 && _title.Length<80 && !al1.Contains(_href) && !al2.Contains(_title)) { href.Add(_href); title.Add(_title); } sonpros = sonpros.Remove(0, sonpros.IndexOf("href=\"http://") + 13); getsonpro(sonpros, href, title); } else if (t_sonpros.IndexOf("href='http://") != -1) { sonpros = sonpros.Remove(0, sonpros.IndexOf("href='http://")); string _href = sonpros.Substring(sonpros.IndexOf("href='http://") + 13, sonpros.Substring(13).IndexOf("'")); string _title = sonpros.Substring(sonpros.IndexOf(">") + 1, sonpros.IndexOf("</a>") - sonpros.IndexOf(">") - 1); if (_href.IndexOf("daohang.google") == -1 && _href.Length < 80 && _title.Length < 80 && !al1.Contains(_href) && !al2.Contains(_title)) { href.Add(_href); title.Add(_title); } sonpros = sonpros.Remove(0, sonpros.IndexOf("href='http://") + 13); getsonpro(sonpros, href, title); } else if (t_sonpros.IndexOf("href=http://") != -1) { sonpros = sonpros.Remove(0, sonpros.IndexOf("href=http://")); string _href = sonpros.Substring(sonpros.IndexOf("href=http://") + 12, sonpros.Substring(12).IndexOf("/")); string _title = sonpros.Substring(sonpros.IndexOf(">") + 1, sonpros.IndexOf("</a>") - sonpros.IndexOf(">") - 1); if (_href.IndexOf("daohang.google") == -1 && _href.Length < 80 && _title.Length < 80 && !al1.Contains(_href) && !al2.Contains(_title)) { href.Add(_href); title.Add(_title); } sonpros = sonpros.Remove(0, sonpros.IndexOf("href=http://") + 12); getsonpro(sonpros, href, title); } else { sonpros=sonpros.Remove(0, 2); getsonpro(sonpros, href, title); } } }这是N久前做的提取HTML代码中链接的HREF和TITLE的,希望对你有帮助 使用网络编辑超级工具箱软件里的格式化功能,这个软件的功能是网页中直接复制过来的文本,格式化一下,查看html源文件就可以全部转换成 <p> </p>形式的,我不知道是咋样实现的,又那位做过的朋友,提供一个思路,谢谢了,这是一个在线的快速格式化的http://www.aboutsoft.cn/fckeditor/,希望看过的朋友。明白的,请给一个思路或方法,非常谢谢,一直没找到好的思路 关于treeview C#如何删除TreeView控件选中结点图标 问个问题,要有耐心啊! excel 转换为 img图片(在线等待...)。 新手问题:关于dataset CompareValidator的问题 c# winform listView如何修改头部颜色以及选中项时突出显示 求大神 跪请高手指点 C# ComboBox如何在下拉事件中赋值选择项 为什么我设置了TabIndex=0,开始运行后还是跑到另外一个按钮上去了? 加载文档时出错 页面无法显示 出现“一个文件正由另一进程使用,因此该进程无法访问该文件”如何处理?
protected void getsonpro(string sonpros, ArrayList href,ArrayList title)
{
if (sonpros.IndexOf("<a") != -1)
{
sonpros = sonpros.Remove(0, sonpros.IndexOf("<a"));
string t_sonpros = sonpros.Substring(0, sonpros.IndexOf("</a>"));
if (t_sonpros.IndexOf("href=\"http://") != -1)
{
sonpros = sonpros.Remove(0, sonpros.IndexOf("href=\"http://"));
string _href = sonpros.Substring(sonpros.IndexOf("href=\"http://") + 13, sonpros.Substring(13).IndexOf("\""));
string _title = sonpros.Substring(sonpros.IndexOf(">") + 1, sonpros.IndexOf("</a>") - sonpros.IndexOf(">") - 1);
if (_href.IndexOf("daohang.google") == -1 && _href.Length < 80 && _title.Length<80 && !al1.Contains(_href) && !al2.Contains(_title))
{
href.Add(_href);
title.Add(_title);
}
sonpros = sonpros.Remove(0, sonpros.IndexOf("href=\"http://") + 13);
getsonpro(sonpros, href, title);
}
else if (t_sonpros.IndexOf("href='http://") != -1)
{
sonpros = sonpros.Remove(0, sonpros.IndexOf("href='http://"));
string _href = sonpros.Substring(sonpros.IndexOf("href='http://") + 13, sonpros.Substring(13).IndexOf("'"));
string _title = sonpros.Substring(sonpros.IndexOf(">") + 1, sonpros.IndexOf("</a>") - sonpros.IndexOf(">") - 1);
if (_href.IndexOf("daohang.google") == -1 && _href.Length < 80 && _title.Length < 80 && !al1.Contains(_href) && !al2.Contains(_title))
{
href.Add(_href);
title.Add(_title);
}
sonpros = sonpros.Remove(0, sonpros.IndexOf("href='http://") + 13);
getsonpro(sonpros, href, title);
}
else if (t_sonpros.IndexOf("href=http://") != -1)
{
sonpros = sonpros.Remove(0, sonpros.IndexOf("href=http://"));
string _href = sonpros.Substring(sonpros.IndexOf("href=http://") + 12, sonpros.Substring(12).IndexOf("/"));
string _title = sonpros.Substring(sonpros.IndexOf(">") + 1, sonpros.IndexOf("</a>") - sonpros.IndexOf(">") - 1);
if (_href.IndexOf("daohang.google") == -1 && _href.Length < 80 && _title.Length < 80 && !al1.Contains(_href) && !al2.Contains(_title))
{
href.Add(_href);
title.Add(_title);
}
sonpros = sonpros.Remove(0, sonpros.IndexOf("href=http://") + 12);
getsonpro(sonpros, href, title);
}
else
{
sonpros=sonpros.Remove(0, 2);
getsonpro(sonpros, href, title);
}
}
}
这是N久前做的提取HTML代码中链接的HREF和TITLE的,希望对你有帮助