公司在做一个中小企业的相关网站,需要实现中文分词查询(这个技术已经解决)。大概数据量在200万左右。因为是中文分词查询,查询里会用到很多模糊字查询,例如用户输入“哪儿的幼儿园有监控头”,会分词成“哪儿/的/幼儿园/有/监控头/”那么这么查询的where子句里会有
where content like '%哪儿%'
or content like '%的%'
or content like '%幼儿园%'
or content like '%有%'
or content like '%监控头%'上述的查询才仅仅是根据content字段查询,这次查询还会根据标题、联系方式、地址都进行查询
这样的话一定会速度很慢的,有什么好的办法吗?谢谢呀~
where content like '%哪儿%'
or content like '%的%'
or content like '%幼儿园%'
or content like '%有%'
or content like '%监控头%'上述的查询才仅仅是根据content字段查询,这次查询还会根据标题、联系方式、地址都进行查询
这样的话一定会速度很慢的,有什么好的办法吗?谢谢呀~
or content like '%的%'
or content like '%幼儿园%'
or content like '%有%'
or content like '%监控头%' 这样的语句不加索引是非常卡的.
谢谢你,不要在数据库做?什么意思那用户输入的企业信息,不放数据库里,放哪儿呢?————————————————————————————我现在正在看sql server的全文检索功能。
不要用,like 用 charindex
刚才查到这篇帖子。我想问下,如果是中文分词,查询数据库的话,是用sql server 2005的全文检索,速度快呢?
还是用Lucenen.net,把数据放置在索引器里,速度快呢?还糊涂,至于什么是“Lucenen.net索引器”我还不知道呢
2.用全文索引,用法baidu..
3.升级硬件;
谢谢你的回复,我现在已经意识到,这样的中文分词后,再进行模糊查询,绝对100%的不能用like。我现在想搞清楚一个问题,用lucence.net的话,是不是要比sql server 05的全文索引要快呀。
2) 建立全文目录 (sp_fulltext_catalog)
3) 在全文目录中注册需要全文索引的表 (sp_fulltext_table)
4) 指出表中需要全文索引的列名 (sp_fulltext_column)
5) 为表创建全文索引 (sp_fulltext_table)
6) 填充全文目录 (sp_fulltext_catalog)
---------********示例********-------------
以对pubs数据库的title和notes列建立全文索引,之后使用索引查询title列或notes列中包含有datebase 或computer字符串的图书名称:在这之前,需要安装Microsoft Search服务,启动SQL server全文搜索服务
user pubs --打开数据库
go
--检查数据库pubs是否支持全文索引,如果不支持
--则使用sp_fulltext_database 打开该功能
if(select databaseproperty('pubs','isfulltextenabled'))=0
execute sp_fulltext_database 'enable'--建立全文目录FT_PUBS
execute sp_fulltext_catalog 'FT_pubs','create'--为title表建立全文索引数据元
execute sp_fulltext_table 'title','create','FT_pubs','UPKCL_titleidind'--设置全文索引列名
execute sp_fulltext_column 'title','title','add'
execute sp_fulltext_column 'title','notes','add'--建立全文索引
--activate,是激活表的全文检索能力,也就是在全文目录中注册该表
execute sp_fulltext_table 'title','activate'--填充全文索引目录
execute sp_fulltext_catalog 'FT_pubs','start_full'
go--检查全文目录填充情况
While fulltextcatalogproperty('FT_pubs','populateStatus')<>0
begin--如果全文目录正处于填充状态,则等待30秒后再检测一次
waitfor delay '0:0:30'
end--全文目录填充完成后,即可使用全文目录检索select title
from
where CONTAINS(title,'database')
or CONTAINS(title,'computer')
or CONTAINS(notes,'database')
or CONTAINS(notes,'database')'--------------以下介绍一下全文操作类的系统存储过程
过程名称:sp_fulltext_service
执行权限:serveradmin或系统管理员
作 用:设置全文搜索属性
过程名称:sp_fulltext_catalog
执行权限:db_owner及更高角色成员
作 用:创建和删除一个全文目录,启动或停止一个全文目录的索引操作
过程名称:sp_fulltext_database
执行权限:db_owner角色成员
作 用:初始化全文索引或删除数据库中所有全文目录
过程名称:sp_fulltext_table
执行权限:db_ddladnmin或db_owner角色成员
作 用:将一个表标识为全文索引表或非全文索引表
过程名称:sp_fulltext_column
执行权限:db_ddladnmin角色成员
作 用:指出一个全文索引表中的那些列假如或退出全文索引
照这样看来。只能使用全文索引了。