如何实现从文章中提取关键字及相关内容?如http://bj.house.sina.com.cn/scan/2009-06-29/1201317531.html里不仅能提取楼盘名字,还有相关的论坛、相册等内容的链接。
解决方案 »
- 现在最佳的PHP开发工具组合是那几个啊?
- 为了提高WEB编程水平,我创了个QQ群:91491754!我们相互学习
- 那里有好用的php站群系统?
- centos释放内存的问题
- php关于apc扩展模块实现上传进度条的问题,
- Sphinx/coreseek安装前准备工作。
- bbs论坛提示 系统维护????求高手
- 在windows中如何利用PHP重启httpd
- 为什么搭建网站一般是 Apache+PHP+MySql而不是 Apache+JAVA+MySql
- 脑袋短路了,麻烦大佬帮我数组入库,谢谢
- 招聘高级PHPL程序员,月薪9000以上
- php程序怎么连同apache,mysql,php一起打包制作成exe安装程序
<?php
$theurl="http://bj.house.sina.com.cn/scan/2009-06-29/1201317531.html";
if (!($contents= file_get_contents($theurl)))
{
echo 'Could not open URL';
exit;
}
$pattern_img='/<img.*src=(\"|\')(.+)\1.*>/U';
$pattern_link='/<a.*>.*<\/a>/U';
if (preg_match_all($pattern_img,$contents,$quote))
{
echo "<p>图片<br />";
foreach($quote[2] as $img)
echo "<img src='".$img."'/><br/>\n";
echo '</p>';
}
else
{
echo '<p>没有图片 </p>';
}
if (preg_match_all($pattern_link,$contents,$quote1))
{
echo "<p>链接<br />";
foreach($quote1[0] as $link)
echo $link."<br/>\n";
echo '</p>';
}
else
{
echo '<p>没有链接 </p>';
}
?>
1、从文章中获取关键字:用正则表达式判断<a></a>,提取文章中的关键字,如楼盘名称;
2、从数据库提取关键字所在的数据表的相关字段,如论坛、相册等字段;
3、判断,提取相关字段链接,显示出来。
写出你要匹配的正则
用正则提取网页内容
根据要求进一步提纯你提取的数据。