如何实现从文章中提取关键字及相关内容?如http://bj.house.sina.com.cn/scan/2009-06-29/1201317531.html里不仅能提取楼盘名字,还有相关的论坛、相册等内容的链接。
解决方案 »
- 招PHP高级工程师
- 哪位大虾知道discuz,ucenter home,ucenter都用了些什么技术啊?
- 请问在dedeCMS中有没有获取上级栏目的方法?
- 财付通借口如何做呢 用php 最简单的。
- 分页类 分页函数, 哪个更好?
- ImageMagick图片处理工具介绍
- Discuz!应用中心是什么原理,那位高手介绍一下。
- php 购物车 删除过期的商品
- 斑竹求教一个阿帕奇rewrite问题
- ubuntu下安装了Zendstudio 10 ,xdebug没配置好,只能CLI调试不能Web调试。
- 招聘高级PHPL程序员,月薪9000以上
- php程序怎么连同apache,mysql,php一起打包制作成exe安装程序
<?php
$theurl="http://bj.house.sina.com.cn/scan/2009-06-29/1201317531.html";
if (!($contents= file_get_contents($theurl)))
{
echo 'Could not open URL';
exit;
}
$pattern_img='/<img.*src=(\"|\')(.+)\1.*>/U';
$pattern_link='/<a.*>.*<\/a>/U';
if (preg_match_all($pattern_img,$contents,$quote))
{
echo "<p>图片<br />";
foreach($quote[2] as $img)
echo "<img src='".$img."'/><br/>\n";
echo '</p>';
}
else
{
echo '<p>没有图片 </p>';
}
if (preg_match_all($pattern_link,$contents,$quote1))
{
echo "<p>链接<br />";
foreach($quote1[0] as $link)
echo $link."<br/>\n";
echo '</p>';
}
else
{
echo '<p>没有链接 </p>';
}
?>
1、从文章中获取关键字:用正则表达式判断<a></a>,提取文章中的关键字,如楼盘名称;
2、从数据库提取关键字所在的数据表的相关字段,如论坛、相册等字段;
3、判断,提取相关字段链接,显示出来。
写出你要匹配的正则
用正则提取网页内容
根据要求进一步提纯你提取的数据。