有HTML DOM呀,可以用来解析HTML。和XML DOM差不多。
解决方案 »
- datagridview刷新
- 关于button的tabindex问题
- 高分在线等:客户端 无法打开到SQL SERVER的连接,请大侠们帮忙,帮顶也有分
- 谁能给一个画图的程序可以鼠标选择,拉伸和移动的.在codeproject下了一个drawtools,但是太复杂,看不懂
- 高分求助:如何在设计器中修改用户控件里面的控件属性
- 这里我想把对应名字的菜单隐藏 要怎么写呀?
- 高分求免费Outlook Toolbar
- 看上去不是很难的问题,但我不会,请教各位
- 奇怪,为何我一执行INSERT数据库就变为制度模式了,不让插入数据阿?各位帮帮我~
- treeview 问题,报错如下,根本没有“c:\WINDOWS\assembly\GAC”这个目录。
- 关于StreamReader和Seek()的疑问
- 高分求教正则表达式,解析HTML
Regex regex = new Regex( pattern, RegexOptions.IgnoreCase );
_HtmlToText = regex.Replace( _HtmlToText, "", -1 );
另,HTML文字内容者在 ">""<"中间.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD><TITLE>foxmail 5.0</TITLE>
<META http-equiv=Content-Type content="text/html; charset=gb2312">
<META content="MSHTML 6.00.3790.0" name=GENERATOR></HEAD>
<BODY background=cid:[email protected]>
<TABLE height="100%" cellSpacing=0 cellPadding=0 width=700 border=0>
<TBODY>
<TR>
<TD vAlign=top width=80>
<DIV> </DIV></TD>
<TD vAlign=top>
<DIV>
<TABLE height="100%" cellSpacing=0 cellPadding=0 width="90%" border=0>
<TBODY>
<TR>
<TD vAlign=top align=left>
<DIV>
<DIV>
<TABLE height="96%" cellSpacing=0 cellPadding=0 width="96%"
border=0>
<TBODY>
<TR>
<TD vAlign=top align=left height=30><FONT face=宋体>
<TABLE style="WIDTH: 458px; HEIGHT: 389px" height="100%"
cellSpacing=0 cellPadding=0 width="90%" border=0>
<TBODY>
<TR>
<TD vAlign=top align=left>
<DIV><FONT size=2><FONT face=宋体><SPAN
id=_FoxTONAME></SPAN>,</FONT><FONT
face=宋体>你好!</FONT></FONT></DIV>
<DIV> </DIV>
<DIV><FONT face=宋体 size=2> sgsgd </FONT></DIV>
<DIV> </DIV>
<DIV><FONT face=宋体 size=2> 致<BR>礼!</FONT></DIV>
<DIV> </DIV>
<DIV>
<DIV><FONT face=宋体>
<DIV><FONT size=2><FONT
face=宋体> 黄宗成<BR></FONT><FONT
face=宋体> <A
href="mailto:[email protected]">[email protected]</A></FONT></FONT></DIV>
<DIV><FONT face=宋体><FONT size=2>
2003-11-18</FONT></FONT></DIV><FONT
size=2> </FONT></FONT></DIV></DIV></TD></TR></TBODY></TABLE></FONT></TD></TR></TBODY></TABLE></DIV></DIV></TD></TR></TBODY></TABLE></DIV></TD></TR>
<TR>
<TD vAlign=bottom align=right width=80 height=30> </TD>
<TD vAlign=bottom align=right height=30><IMG height=209
src="cid:[email protected]" width=219></TD></TR></TBODY></TABLE></BODY></HTML>
Regex regex = new Regex( pattern, RegexOptions.IgnoreCase );
_newHtmlToText = regex.Replace( _oldHtmlToText, "", -1 );_oldHtmlToText是你原先的HTML字符串,如"<img src="1.jpg">dddd<a></a>"
xhn_21199,你好!
9999999999999999999
致礼!
黄宗成 [email protected]
2003-11-15请问怎么去掉那些 
xhn_21199,你好!
9999999999999999999
致礼!
黄宗成
[email protected]
2003-11-15
把你现在拿到的东西再作一次HTMLDecode应该就可以了。
请问HTMLDecode怎么用,能否把代码贴出来
该怎么解决啊?
使用DHTML DOM组件编译HTML文档 这是比较正统的做法. http://asp.6to23.com/connect/dispbbs.asp?boardid=14&id=17