<TD class=zt14 id=Zoom2 style="PADDING-RIGHT: 20px; PADDING-LEFT: 20px; LINE-HEIGHT: 24px; PADDING-TOP: 20px" vAlign=top height=200 htjs_title="正文内容" htjs_isnull="1" htjs_sign="content_simple">
<P> 因需要进行设备维护,河南省国家税务局定于2009年4月28日晚6时至2009年4月29日早8时,暂时停止各类网上办税业务,由此给您带来的不变,敬请谅解,谢谢合作。<BR> 特此通知。<BR> 河南省国家税务局<BR> 二OO九年四月二十七日<BR></P></TD><TD (其他) htjs_title="正文内容" (其他) >内容</TD>具体格式如上
提取内容怎么写呢 其中 htjs_title="正文内容" 是固定的 求正则表达式
<P> 因需要进行设备维护,河南省国家税务局定于2009年4月28日晚6时至2009年4月29日早8时,暂时停止各类网上办税业务,由此给您带来的不变,敬请谅解,谢谢合作。<BR> 特此通知。<BR> 河南省国家税务局<BR> 二OO九年四月二十七日<BR></P></TD><TD (其他) htjs_title="正文内容" (其他) >内容</TD>具体格式如上
提取内容怎么写呢 其中 htjs_title="正文内容" 是固定的 求正则表达式
<script type="text/javascript">
<!--
var str = '<TD class=zt14 id=Zoom2 style="PADDING-RIGHT: 20px; PADDING-LEFT: 20px; LINE-HEIGHT: 24px; PADDING-TOP: 20px" vAlign=top height=200 htjs_title="正文内容" htjs_isnull="1" htjs_sign="content_simple"><P> 因需要进行设备维护,河南省国家税务局定于2009年4月28日晚6时至2009年4月29日早8时,暂时停止各类网上办税业务,由此给您带来的不变,敬请谅解,谢谢合作。 <BR> 特此通知。 <BR> 河南省国家税务局 <BR> 二OO九年四月二十七日 <BR> </P> </TD>' var reg = /<td[^>]*>(.*?)<\/td>/i;
alert(str.match(reg)[1]);
//-->
</script>没必要用正则
<!--
var str = '<TD class=zt14 id=Zoom2 style="PADDING-RIGHT: 20px; PADDING-LEFT: 20px; LINE-HEIGHT: 24px; PADDING-TOP: 20px" vAlign=top height=200 htjs_title="正文内容" htjs_isnull="1" htjs_sign="content_simple"><P>11111111111111 </P> </TD><TD class=zt14 id=Zoom2 style="PADDING-RIGHT: 20px; PADDING-LEFT: 20px; LINE-HEIGHT: 24px; PADDING-TOP: 20px" vAlign=top height=200 htjs_title="正文内容" htjs_isnull="1" htjs_sign="content_simple"><P>2222222222222222</P> </TD>' var reg = /<td[^>]*htjs_title="正文内容"[^>]*>(.*?)<\/td>/ig;
var arr = str.match(reg), arr1 = [];
for(var i = 0; i < arr.length; i++){
arr1.push(RegExp.$1)
}
alert(arr1)
//-->
</script>
<body><table><tr>
<TD class=zt14 id='Zoom2' style="PADDING-RIGHT: 20px; PADDING-LEFT: 20px; LINE-HEIGHT: 24px; PADDING-TOP: 20px" vAlign=top height=200 htjs_title="正文内容" htjs_isnull="1" htjs_sign="content_simple">
<P> 因需要进行设备维护,河南省国家税务局定于2009年4月28日晚6时至2009年4月29日早8时,暂时停止各类网上办税业务,由此给您带来的不变,敬请谅解,谢谢合作。 <BR> 特此通知。 <BR> 河南省国家税务局 <BR> 二OO九年四月二十七日 <BR> </P> </TD><TD (其他) htjs_title="正文内容" (其他) >内容 </TD>
</tr>
</table>
</body>
<script>
var o=document.getElementById("Zoom2")
if (document.all){alert(o.innerText)}
else{alert(o.textContent)}</script>
window.onload=function(){
var o=document.getElementById("Zoom2")
sText=document.all?o.innerText:o.textContent;
document.getElementById("hiddenZoom2").value=sText
}</script><body>
<form method=post .................>
<table> <tr>
<TD class=zt14 id='Zoom2' style="PADDING-RIGHT: 20px; PADDING-LEFT: 20px; LINE-HEIGHT: 24px; PADDING-TOP: 20px" vAlign=top height=200 htjs_title="正文内容" htjs_isnull="1" htjs_sign="content_simple">
<P> 因需要进行设备维护,河南省国家税务局定于2009年4月28日晚6时至2009年4月29日早8时,暂时停止各类网上办税业务,由此给您带来的不变,敬请谅解,谢谢合作。 <BR> 特此通知。 <BR> 河南省国家税务局 <BR> 二OO九年四月二十七日 <BR> </P> </TD><TD (其他) htjs_title="正文内容" (其他) >内容 </TD>
</tr>
</table>
<input type=hidden id=hiddenZoom2 name=hiddenZoom2 />
<input type=submit id=s name=s value=提交 />
</form>
</body>
发错版了
我想正则都一样 我只是在后台用java执行不就可以了吗 谢谢了
发错版了 我想正则都一样 我只是在后台用java执行不就可以了吗 谢谢了
按楼主的意思也许表格固定的:
如果楼主的表格有ID,如果取内容包含html标签那么用我1楼的innerHTML就可以了,如果不要html标签那么用5楼的就可以
如果表格没有ID只有一个htjs_title="正文内容"的标识,那么就可以用我4楼的正则
语言不同,对于正则的支持有很大的不同,元字符,匹配模式,语法规则等都是有区别的//如果TD标签没有嵌套
String test = "first <TD class=zt14 id=Zoom2 style=\"PADDING-RIGHT: 20px; PADDING-LEFT: 20px; LINE-HEIGHT: 24px; PADDING-TOP: 20px\" vAlign=top height=200 htjs_title=\"正文内容\" htjs_isnull=\"1\" htjs_sign=\"content_simple\"> <P> 因需要进行设备维护,河南省国家税务局定于2009年4月28日晚6时至2009年4月29日早8时,暂时停止各类网上办税业务,由此给您带来的不变,敬请谅解,谢谢合作。 <BR> 特此通知。 <BR> 河南省国家税务局 <BR> 二OO九年四月二十七日 <BR> </P> </TD> second <TD class=zt15 id=Zoom3 style=\"PADDING-RIGHT: 20px; PADDING-LEFT: 20px; LINE-HEIGHT: 24px; PADDING-TOP: 20px\" vAlign=top height=200 htjs_title=\"正文内容\" htjs_isnull=\"1\" htjs_sign=\"content_simple\"> <P> 因需要进行设备维护,河南省国家税务局定于2009年4月28日晚6时至2009年4月29日早8时,暂时停止各类网上办税业务,由此给您带来的不变,敬请谅解,谢谢合作。 <BR> 特此通知。 <BR> 河南省国家税务局 <BR> 二OO九年四月二十七日 <BR> </P> </TD> end";
String reg = "(?is)<TD\\s(?:(?!htjs_title=).)*htjs_title=\"正文内容\"[^>]*>(?:(?!<?/TD\\b).)*</TD>";
Matcher m = Pattern.compile(reg).matcher(test);
while(m.find())
{
System.out.println(m.group());
}如果TD标签有嵌套,Java中目前很难用正则实现,.NET中提供了平衡组,可以处理嵌套结构
将网页内容拷贝到一个新建的文件中。
<TD class=zt14 id=Zoom2 style="PADDING-RIGHT: 20px; PADDING-LEFT: 20px; LINE-HEIGHT: 24px; PADDING-TOP: 20px" vAlign=top height=200 htjs_title="正文内容" htjs_isnull="1" htjs_sign="content_simple">
<P> 因需要进行设备维护,河南省国家税务局定于2009年4月28日晚6时至2009年4月29日早8时,暂时停止各类网上办税业务,由此给您带来的不变,敬请谅解,谢谢合作。 <BR> 特此通知。 <BR> 河南省国家税务局 <BR> 二OO九年四月二十七日 <BR> </P> </TD>
2. 点排序按钮,选择“比较由正则表达式定义的字符串”,输入下面的正则表达式和目标字符串(注意正则表达式没有空格,空格是CSDN添加的):
正则表达式:<TD*htjs_title="正文内容"*>[]*</TD>
目标字符串:%06\r\n3. 点“将目标字符串拷贝到剪贴板”,即可将你要的数据拷贝到剪贴板:<P> 因需要进行设备维护,河南省国家税务局定于2009年4月28日晚6时至2009年4月29日早8时,暂时停止各类网上办税业务,由此给您带来的不变,敬请谅解,谢谢合作。 <BR> 特此通知。 <BR> 河南省国家税务局 <BR> 二OO九年四月二十七日 <BR> </P>