急急急!如何用正则表达式提取网页源代码中的特定内容! 要做一个类似纯文本网页浏览器的东东,不知道怎么写正则表达式提取网页源代码中的内容,要求保留文字和链接,其他的图片,声音文件都不需要 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 楼主如果牛b的话直接写html的渲染引擎好了~~~我看楼主连html都不大了解~~哎~~~ html的渲染引擎?没什么用处,我要求是把源代码分离,不单单是显示问题!要求留HTML的构架和格式 楼主应该把问题讲清楚,有时实际一个东西有很多途径。比如:若只是显示HTML,那你可以用.NET2005中的webbrowse。同时WEBBROWSE中还支持javascript,能灵活处理HTML的节点。 是不是要解析下 DOM 树呢……感觉比自己写 Regex 的规则容易些吧……没怎么做过 .NET 下的 XML 处理……不过网页要是不规范就不好弄了吧…… 我是用WEBBROWSE,当然是要最终还是显示一个HTML形式,其实目的就是一个,提取网页代码中的特定内容,即文本信息!但是链接保留。懂正则的帮忙看看这个正则行不行啊,但是VB里的,怎么把它改到c#中去?New Regex("<(?<outeratg>[a-z]+[\d]?)(?<attributes>[^>]*)*>" &_"(?<interhtml>)(<(?<innertag>[a-z]+[\d]?)[^>]" &_"*>.*?<^k<intertag>>|<[a-z]+[\d]?[^[>]*>|" &_"(?>[^<]*))*(?=<^k<outertag>>))?",_Regexoptions.ignorecase Or_Regexoptions.complied Or_Regexoptions.Explicitcapture Or_Regexoptions.singleLine) 图片放大后显示在PictueBox,怎么获取左右没有显示出来部分的大小呢? 在线急急 ~ sql 语句 解决立即给分 我的.NET一启动就报错,请大家来看看,谢谢了(在线等。。。) 一题一百分求答案或思路(对CAD开发感兴趣的兄弟也进来看看) C#如何上传文件数据.急急急. 求教个记住密码的问题 AES 加密图象文件源码,急求,谢谢大家! c#中命名空间的问题---超低级问题 如何得到磁盘的类型以及磁盘卷标? C# webBrowser控件在IE8的电脑上网页显示不完整 急切需要高手解决C#中excel导出问题.谢谢! 急急~~求救~~
我看楼主连html都不大了解~~哎~~~
比如:若只是显示HTML,那你可以用.NET2005中的webbrowse。同时WEBBROWSE中还支持javascript,能灵活处理HTML的节点。
不过网页要是不规范就不好弄了吧……
New Regex("<(?<outeratg>[a-z]+[\d]?)(?<attributes>[^>]*)*>"
&_"(?<interhtml>)(<(?<innertag>[a-z]+[\d]?)[^>]"
&_"*>.*?<^k<intertag>>|<[a-z]+[\d]?[^[>]*>|"
&_"(?>[^<]*))*(?=<^k<outertag>>))?",_Regexoptions.ignorecase
Or_Regexoptions.complied Or_Regexoptions.Explicitcapture
Or_Regexoptions.singleLine)