如何处理页面的关键字和描述 新闻类,程序自动从其他网站获取正文,然后保存成html文件,如何获取正文中的关键字信息,把静态页面里的keyword和Description内容替换掉 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 想要得到可以替换掉keyword内容的数据,必须从数据库中提取关键字,数据的保存格式类似于论坛的分区和帖子之间的父子关系。但,问题是关键字如何生成。我觉得生成关键字方式主要分为以下两种:1.手动提交 也就是在提交新闻的时候,有一个关键字的栏,人工输入需要的关键字。2.自动提交提交新闻的时候根据内容生成 从一篇文章中提取关键字是一项很繁琐的运算,通常叫做分词,也是搜索引擎的关键技术之一。 想要做到即使提取是不太可能的。可以分为以下两种: 2.1 提交新闻时自动输入 提交新闻的时候,可以用JavaScript从内容中提取关键字,当然,如果内容较长,提取的时间也会变长。 不过,提交内容的时间稍微长一点,通常不会影响到UI的操作质量,而且,具体想要分析到哪一步,可以根据情况而定。 2.2 后台程序自动生成 简而言之,就是用一个后台程序,分析新闻内容,然后自动生成关键字信息,保存到数据库中。DZ论坛关键字的提取,就是方法1和2.1的结合。lz可以根据自己的需求选择适合自己的方法。 问个关于csdn 的blog 的问题。 MetInfo4.0安装报错 联想thinkpadt400 用php写的注册页面代码,当把注册信息提交时总不能成功,请大家帮忙! win+apache+php支持GD下无法显示验证码 发这里看看 mysql 嵌套查询的问题 php 面向过程的框架,仿webwork,需要高手指点 在服务器上下载文件出现了这样的情况,希望大家能帮忙看看,谢谢了 有人做过curl 登录qq邮箱或者webqq吗 windows 下创建 apache+mysql+php环境后,运行上传文件程序出现的问题 oracle 最后哦那你个插入 clob类型的值出现
数据的保存格式类似于论坛的分区和帖子之间的父子关系。但,问题是关键字如何生成。我觉得生成关键字方式主要分为以下两种:
1.手动提交
也就是在提交新闻的时候,有一个关键字的栏,人工输入需要的关键字。
2.自动提交提交新闻的时候根据内容生成
从一篇文章中提取关键字是一项很繁琐的运算,通常叫做分词,也是搜索引擎的关键技术之一。
想要做到即使提取是不太可能的。可以分为以下两种:
2.1 提交新闻时自动输入
提交新闻的时候,可以用JavaScript从内容中提取关键字,当然,如果内容较长,提取的时间也会变长。
不过,提交内容的时间稍微长一点,通常不会影响到UI的操作质量,而且,具体想要分析到哪一步,可以根据情况而定。
2.2 后台程序自动生成
简而言之,就是用一个后台程序,分析新闻内容,然后自动生成关键字信息,保存到数据库中。DZ论坛关键字的提取,就是方法1和2.1的结合。
lz可以根据自己的需求选择适合自己的方法。