用什么方法提取文本中的所有<a></a>中的内容,(正则还是其它??) 系统win2003,php5.0, iis 因为我要分析读取的文本所有的连接<a></a>内容 ,然后传到数组中,用正则或还是其它方法,怎样处理,谢谢各位指点。 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 <a href="http://www.163.com" id='test'>网易</a><SCRIPT LANGUAGE="JavaScript"><!-- alert(document.getElementById('test').innerText);//--></SCRIPT> 楼上的,如果a没有id呢?还是用document.getElementsByTagName("a")去做 各位我的具体意思是:我要从远程抓取一网页,分析其连接内容比如有一段文本:“HUHJU <a>ABCD</a>,jdalkjdksad <a>99999</a>”得出的结果将ABCD和99999填充到数组中。 用正则应该可以,但对其不太了解,请指点。。 对于一个字符串,可先定位<a>然后找</a>把中间的内容放到数组里,然后将其第一部分的a标签段落截掉,然后继续这个循环。这个方法比较笨吧。我就会这个或者用split 再怎么着处理一下 这个就已经可以了啊。顺便再问问xiaojing7 大侠的:document.getElementsByTagName("a")我怎么用了alert窗口提示的值变成undefinde了呢?我改成document.getElementsByTagName("a").innerText,还是不行。alert窗口提示的值变成object了。小弟对js不熟,这个问题可能很初级,请大侠有空的话指正。 -------------------我只是个菜鸟,大侠不敢当getElementsByTagName 你写正确了吗?楼主如果想得到链接的话 直接document.getElementsByTagName("a").getAttribute("title")还有你直接得到的getElementsByTagName 就是一个数组 我明白了,查了半天。IE不支持document.getElementsByTagName是不是啊? 正则的话,用:/<a[^>]*>(.*?)<\/a>/i <body><a href="http://www.163.com" id='test'>网易 </a> <SCRIPT LANGUAGE="JavaScript"><!-- var tempstr=document.getElementsByTagName('a');alert(tempstr.item(0).text);//--> </SCRIPT></body>这段,在IE下不能显示出“网易”那两个字。在FF下正常。 具体情况有具体办法,主要看你的来源数据的规律性,楼上的好几位的方法都可以,但真正要可行,还要看你的数据具体情况适当些。Sooth说的数组拆分其实也可以Aylazhang说的正则也不错 document.getElementsByTagName("a")[0].innerText document.getElementsByTagName取得的为数组 请问高手,关于导入php源代码的问题 求助啊,带键值的数组要怎么合并? 求助帮我把一段简单的PHP代码转换成ASP的 php5.22的问题,再现求解~~~~ 大家来说什么样的水平叫PHP高级工程师 导出到EXCEL的数据的乱码? 【100分】问两个基础问题,mysql的位运算和十六进制 哪儿有支持PHP的小虚拟空间? @ 正则表达式 求助! thinkphp重写url发现提示 500服务错误 求一SQL语句问题 请高手帮忙 关于apc(php)
<SCRIPT LANGUAGE="JavaScript">
<!--
alert(document.getElementById('test').innerText);
//-->
</SCRIPT>
这个方法比较笨吧。我就会这个
或者用split 再怎么着处理一下
这个就已经可以了啊。
顺便再问问xiaojing7 大侠的:
document.getElementsByTagName("a")
我怎么用了alert窗口提示的值变成undefinde了呢?
我改成document.getElementsByTagName("a").innerText,还是不行。
alert窗口提示的值变成object了。小弟对js不熟,这个问题可能很初级,请大侠有空的话指正。
我只是个菜鸟,大侠不敢当getElementsByTagName 你写正确了吗?
楼主如果想得到链接的话 直接document.getElementsByTagName("a").getAttribute("title")还有你直接得到的getElementsByTagName 就是一个数组
IE不支持document.getElementsByTagName是不是啊?
/<a[^>]*>(.*?)<\/a>/i
<body>
<a href="http://www.163.com" id='test'>网易 </a>
<SCRIPT LANGUAGE="JavaScript">
<!--
var tempstr=document.getElementsByTagName('a');
alert(tempstr.item(0).text);
//-->
</SCRIPT>
</body>
这段,在IE下不能显示出“网易”那两个字。在FF下正常。
Aylazhang说的正则也不错
document.getElementsByTagName取得的为数组