比如百度搜索新闻,它能够得到别的网站新闻的标题、时间、作者、来源、内容、那是一字不差,
我这样想,如果是一个网站,可以写规则,那么多网站不可能写那么多规则吧,
比如标题,有的用
<h3>标题</h3>
<h3 class="*">标题</h3>
<h3 id="*">标题</h3>
<p>标题</p>
...
标签不一样规则就不一样吧,百度如何做到的呢,那么准确,不可能写出万能的正则,要么那些网站提供了api,我觉得可能性很小,要么手动编辑内容,可能性更小。
我这样想,如果是一个网站,可以写规则,那么多网站不可能写那么多规则吧,
比如标题,有的用
<h3>标题</h3>
<h3 class="*">标题</h3>
<h3 id="*">标题</h3>
<p>标题</p>
...
标签不一样规则就不一样吧,百度如何做到的呢,那么准确,不可能写出万能的正则,要么那些网站提供了api,我觉得可能性很小,要么手动编辑内容,可能性更小。
解决方案 »
- 菜鸟请教如何把一段文字上传到服务器 然后通过地址显示呢?
- 请教下各位老师~关于Discuz7.2论坛背景图片的修改!
- 紧急求助shopex网店问题
- PHP TEXTAREA换行
- zencart兰亭模板问题。Warning: Call-time pass-by reference
- 急!!连接phpMyAdmin-3.4.3.2-all-languages报错!求解!
- statusnet不能上传文件,图片,视频等??
- 面试问题:给你一个文本文件,里面存储了一亿个QQ号,请用程序将其由小到大排序,汗呀!..
- discuz.语言包切换 (中英双语切换)
- 求推荐一个cms
- 用CI框架写发送邮件程序,为什么会报错呢?
- 我想要知道文章24小时之内的点击数
换句话,title是写给搜索引擎看的,h1,h2,h3是写给人看的。
但是时间、作者、来源、内容呢,可不是这样的啊
————————————————————————————————
基于CSDN论坛提供的插件扩展功能,自己做了个签名档工具,分享给大家,欢迎技术交流 :)