最近遇到一个比较迷惑的问题:
数据库中有一个NVarchar字段"SKU"建立了全文索引,断字语言是English
有如下的两条数据: 
1:N-710-SH-1
2:710-SH-1B使用条件CONTAINS(SKU,'710-SH-1')时,两条记录均能查到
但是使用CONTAINS(SKU,'"710-SH-1*"')时,只能查到710-SH-1B这行,不知为何,请高手指点

解决方案 »

  1.   

    --参考
    -------------开启全文索引和创建全文索引目录
    exec sp_fulltext_database 'enable'
    --exec sp_fulltext_catalog 'gf_ft','drop'
    exec sp_fulltext_catalog 'gf_ft','create'
    -------------为news表创建全文索引 可索引列为 title,abstract,textexec sp_fulltext_table 'product','create','gf_ft','pk_product'
    exec sp_fulltext_column 'product','productname','add'-------------激活索引
    exec sp_fulltext_table 'product','activate'
    exec sp_fulltext_table 'product','start_full'--检查全文目录填充情况
    While fulltextcatalogproperty('gf_ft','populateStatus')<>0
    begin--如果全文目录正处于填充状态,则等待5秒后再检测一次
    waitfor delay '0:0:5'
    ENDexec sp_fulltext_catalog 'gf_ft','start_full'--检查全文目录填充情况
    While fulltextcatalogproperty('gf_ft','populateStatus')<>0
    begin--如果全文目录正处于填充状态,则等待5秒后再检测一次
    waitfor delay '0:0:5'
    END
    --------------测试------------------
    SELECT * FROM product WHERE CONTAINS(productname,'美赞臣')-----------------------卸载------------------EXEC sp_fulltext_table 'product','deactivate'
    exec sp_fulltext_column 'product', 'productname', 'drop'
    EXEC sp_fulltext_table 'product', 'drop'
    EXEC sp_fulltext_catalog 'gf_ft', 'stop'
    EXEC sp_fulltext_catalog 'gf_ft', 'drop'2.先了解一下全文索引是如何创建和使用的 
          创建全文索引: 
          在MS SQL SERVER 2005里,全文索引是一个单独的服务项,默认是启动的,但是没有允许数据库启用全文索引,如果要在某个数据库中创建全文索引,先要启用数据库的全文索引.
          启用方法:
          1.数据库->属性->常规->启用全文索引
          2.在查询中执行:sp_.........忘了,如果没有启用就执行创建索引目录,会提示. 
          
          启用了索引了,就可以创建索引目录了
          在查询中执行以下语句:
          CREATE FULLTEXT CATALOG 索引目录名 
          执行以后,就会在SQL SERVER的安装目录里看到一个同名的目录名了,路径为MSSQL.1/MSSQL/FTDATA/索引目录名 
          
          每个表只可以有一个全文索引,存放在指定的索引目录里,可以通过向导创建,也可以通过SQL创建
          基本语法:
          CREATE FULLTEXT INDEX ON tablename
          (索引列1,索引列2...)
          KEY INDEX indexname ON 索引目录名 
          indexname是指已存在的基于指定表的唯一索引名.而不是唯一索引列名.如果索引不存在,需要先创建唯一索引. 
          
          使用全文索引: 
          主要使用CONTAINS,FREETEXT进行查询 
          假设已有一个表music,已为字段memo创建全文索引,那么要查询含有周杰伦或者jay的所有记录的语句为:
          SELECT * FROM music WHERE CONTAINS(memo,'"周杰伦" or "jay"') 
          也可以使用匹配模式进行包含条件组合,还可以使用and连接条件.
      

  2.   

    最新发现使用CONTAINS(SKU,'"1*"')时,就只出现了710-SH-1B这行,是不是跟断词有关系呢?
      

  3.   

    有点开窍了,推测如下:
    由于0-9这10个阿拉伯数字都是在noise列表中的,断词后,全文索引看"N-710-SH-1"就等于N+710+SH,而710-SH-1B 等于710+SH+1B,所以当查询CONTAINS(SKU,'"1*"')或者CONTAINS(SKU,'"710-SH-1*"')时,只能找到710-SH-1B
      

  4.   

    貌似N也会被当做noise排除掉,"N-710-SH-1"实际等于710+SH
      

  5.   

    http://blog.csdn.net/HEROWANG/archive/2009/08/11/4436623.aspx
    是干扰词的原因