服务器端xhr捉去数据分析得到description标签的内容返回就行了,这个标签一般放的都是摘要的多
解决方案 »
- 我有一函数不执行$(this),$("table tr").mouseout( function(){aliert($(this).attr("backgro}
- Button按钮默认为提交按钮?
- 请教建站注意事项,希望兄弟们多多评价我的想法,谢谢。
- 怎样去获取多个ID呢?
- 请问jQuery如何得到服务器返回值?
- 问个javascript的Math.floor
- 小弟是个asp初学者,刚做了个菜鸟级的网站,请大家参观下并给些建议,谢谢!
- 在table中显示某一个文件夹里的文件的信息的问题!!
- 一个滚屏的问题
- 了解 javascript 中类的感念的请进
- 关于正则表达式的一个问题。。。。。。急用 easyui
- form提交打开新标签
原理应该不难,说白了就是ajax技术,输入完网址,把该网址自动提交到腾讯的后台进行处理,然后处理完,把返回的信息再显示出来。
如果你要做这个,也只能去解析该网址返回的数据文档,再从中,用正则等方式去获取自己想要网站摘要等信息,再显示出来。
二楼说找description标签,但有些网站没有这个标签,你就要自己找别的方式取有用信息了。
网页正文抽取有什么成熟的算法和系统原型吗?
能详细介绍一下正则的方法么,3楼的同志!
一个网站首页的,内容,五花八门,有公司介绍,有联系方式,有手机号,QQ号,邮箱地址等等。。
如果是新闻,还有新闻标题,内容啊
这方面就涉及到网络爬虫等相关技术了,百度,google就是这样去获取网络上公开站点的信息,然后把数据导入自己的数据库中,供用户查询。
原理应该就类似这样吧,但具体我也没做过这些,也只是了解一点,你自己可以再多搜索下爬虫等相关技术。
正则只是用来获取自己想要的某些规则的内容,如,你只想要这个网页的QQ号,QQ号一些是6-10位数字,你要写一个匹配6-10数字的正则表达式,再去取值