Microsoft® SQL Server™ 2000 全文索引为在字符串数据中进行复杂的词搜索提供有效支持。全文索引存储关于重要词和这些词在特定列中的位置的信息。全文查询利用这些信息,可快速搜索包含具体某个词或一组词的行。全文索引包含在全文目录中。每个数据库可以包含一个或多个全文目录。一个目录不能属于多个数据库,而每个目录可以包含一个或多个表的全文索引。一个表只能有一个全文索引,因此每个有全文索引的表只属于一个全文目录。全文目录和索引不存储在它们所属的数据库中。目录和索引由 Microsoft 搜索服务分开管理。

解决方案 »

  1.   

    为什么全文检索查询的速度比 like查询 的速度快? ???
      

  2.   

    而like操作,是直接对存储在所属数据库表上的数据页或者索引页进行扫描,被匹配的关键字或关键词在数据库中并没有记录他们所在的位置信息。
      

  3.   

    一个完整的SQL SERVER数据库全文索引的示例。(以pubs数据库为例)首先,介绍利用系统存储过程创建全文索引的具体步骤:1) 启动数据库的全文处理功能          (sp_fulltext_database)
    2) 建立全文目录                      (sp_fulltext_catalog)
    3) 在全文目录中注册需要全文索引的表  (sp_fulltext_table)
    4) 指出表中需要全文索引的列名        (sp_fulltext_column)
    5) 为表创建全文索引                  (sp_fulltext_table)
    6) 填充全文目录                      (sp_fulltext_catalog)
    ---------********示例********-------------
    以对pubs数据库的title和notes列建立全文索引,之后使用索引查询title列或notes列中包含有datebase 或computer字符串的图书名称:在这之前,需要安装Microsoft Search服务,启动SQL server全文搜索服务
    user pubs --打开数据库
    go
    --检查数据库pubs是否支持全文索引,如果不支持
    --则使用sp_fulltext_database 打开该功能
    if(select databaseproperty('pubs','isfulltextenabled'))=0 
      execute sp_fulltext_database 'enable'--建立全文目录FT_PUBS
    execute sp_fulltext_catalog 'FT_pubs','create'--为title表建立全文索引数据元
    execute sp_fulltext_table 'title','create','FT_pubs','UPKCL_titleidind'--设置全文索引列名
    execute sp_fulltext_column 'title','title','add'
    execute sp_fulltext_column 'title','notes','add'--建立全文索引
    --activate,是激活表的全文检索能力,也就是在全文目录中注册该表
    execute sp_fulltext_table 'title','activate'--填充全文索引目录
    execute sp_fulltext_catalog 'FT_pubs','start_full'
    go--检查全文目录填充情况
    While fulltextcatalogproperty('FT_pubs','populateStatus')<>0
    begin--如果全文目录正处于填充状态,则等待30秒后再检测一次
    waitfor delay '0:0:30'
    end--全文目录填充完成后,即可使用全文目录检索select title
    from
    where CONTAINS(title,'database')
    or CONTAINS(title,'computer')
    or CONTAINS(notes,'database')
    or CONTAINS(notes,'database')'--------------以下介绍一下全文操作类的系统存储过程
    过程名称:sp_fulltext_service
    执行权限:serveradmin或系统管理员
    作    用:设置全文搜索属性
    过程名称:sp_fulltext_catalog
    执行权限:db_owner及更高角色成员
    作    用:创建和删除一个全文目录,启动或停止一个全文目录的索引操作
    过程名称:sp_fulltext_database
    执行权限:db_owner角色成员
    作    用:初始化全文索引或删除数据库中所有全文目录
    过程名称:sp_fulltext_table
    执行权限:db_ddladnmin或db_owner角色成员
    作    用:将一个表标识为全文索引表或非全文索引表
    过程名称:sp_fulltext_column 
    执行权限:db_ddladnmin角色成员
    作    用:指出一个全文索引表中的那些列假如或退出全文索引
      

  4.   

    使用like查询大多数情况下,索引失效.
      

  5.   

    全文目录和索引
    Microsoft® SQL Server™ 2000 全文索引为在字符串数据中进行复杂的词搜索提供有效支持。全文索引存储关于重要词和这些词在特定列中的位置的信息。全文查询利用这些信息,可快速搜索包含具体某个词或一组词的行。全文索引包含在全文目录中。每个数据库可以包含一个或多个全文目录。一个目录不能属于多个数据库,而每个目录可以包含一个或多个表的全文索引。一个表只能有一个全文索引,因此每个有全文索引的表只属于一个全文目录。全文目录和索引不存储在它们所属的数据库中。目录和索引由 Microsoft 搜索服务分开管理。全文索引必须在基表上定义,而不能在视图、系统表或临时表上定义。 全文索引的定义包括: 能唯一标识表中各行的列(主键或候选键),而且不允许 NULL 值。
    索引所覆盖的一个或多个字符串列。 
    全文索引由键值填充。每个键的项提供与该键相关联的重要词(干扰词或终止词除外)、它们所在的列和它们在列中的位置等有关信息。格式化文本字符串(如 Microsoft® Word™ 文档文件或 HTML 文件)不能存储在字符串或 Unicode 列中,因为这些文件中的许多字节包含不构成有效字符的数据结构。数据库应用程序可能仍需要访问这些数据并对其应用全文检索。因为 image 列并不要求每一字节都构成一个有效字符,所以许多站点将这类数据存储在 image 列中。SQL Server 2000 引入了对存储在 image 列中的这些类型的数据执行全文检索的能力。SQL Server 2000 提供筛选,可从 Microsoft Office™ 文件(.doc、.xls 和 .ppt 文件)、文本文件(.txt 文件)及 HTML 文件(.htm 文件)中析取文本化数据。设计表时除包括保存数据的 image 列外,还需包括绑定列来保存存储在 image 列中的数据格式的文件扩展名。可以创建引用 image 列和绑定列的全文索引,以便在存储于 image 列中的文本化信息上启用全文检索。SQL Server 2000 全文检索引擎使用绑定列中的文件扩展名信息,选择从列中析取文本化数据的合适的筛选。全文索引是用于执行两个 Transact-SQL 谓词的组件,以便根据全文检索条件对行进行测试: CONTAINS
    FREETEXT 
    Transact-SQL 还包含两个返回符合全文检索条件的行集的函数: CONTAINSTABLE
    FREETEXTTABLE 
    SQL Server 在内部将搜索条件发送给 Microsoft 搜索服务。Microsoft 搜索服务查找所有符合全文检索条件的键并将它们返回给 SQL Server。SQL Server 随后使用键的列表来确定表中要处理的行。
      

  6.   

    没有使用全文检索的时候,大部分用户会利用WHERE子句匹配LIKE关键词,在庞大的数据字段中搜索某些想要的字,如:
    WHERE Notes LIKE '%小梁%'然而这种查询方式非常没有效率,即使在Notes字段建立了一般的索引,帮助也不大,因为SQL SERVER为数据表建立的索引是排序过的数据结构。因此,可以用二分搜索算法来快速寻找数据,但搜索'%小梁%'可没有什么顺序可言,因为搜索条件以'%'开头。全文检索则提供完全不同的索引架构,以关键词为基础建立全文检索索引。搭配特有的SQL查询语法,对于大型文本的字词查询更具弹性和效率
      

  7.   

    全文检索索引架构是将文本一个一个拆开来,标示哪个字词在哪笔记录,哪个字段的什么位置出现,我们就以Northwind数据库的Employees数据表Notes字段为例,建立全文检索,示意架构如下:
    College:4,3,9
    degree:7,5,3,9
    university:7,6,5,2,1,8将逐字切开Notes字段中所有的文本内容,每个字都标示着哪几笔记录出现。
    例如现在的College这个字分别在Employees表的4,3,9三笔记录中出现。
      

  8.   

    谢谢 liangCK !MS有点明白了,但是 College,degree,university这些词是怎么分出来得呢?如果有标点符号怎么分?这样一个单词一个单词地分,那查询短语或句子如何实现呢?比如,查询“中国,地大物博!”这样的句子查询效率在全文索引里面怎么体现的呢?
      

  9.   


    SQL Server的全文检索引擎有一个断词工具。