有把PDF转成TXT的插件,利用这插件转成TXT文件,对TXT检索就方便了。

解决方案 »

  1.   

    看帮助吧!筛选支持的文件类型
    当 image 列中的一个单元包含某种特定类型的文档时,全文检索将使用筛选来解释二进制数据。筛选会从该文档析取文本化信息然后提交,用于进行索引和后续查询。Microsoft? SQL Server? 2000 包含用于下列文件扩展名的筛选:.doc、.xls、.ppt、.txt 和 .htm。许多文档类型可以存储在单个 image 列中。对于每种文档,SQL Server 根据文件扩展名选择正确的筛选。因为当文件存储在 image 列中时,文件扩展名是不可见的,所以扩展名必须另外存储在表上单独的列中。这一类型列可以是任何基于字符的数据类型,并包含文档的文件扩展名,如用于 Microsoft Word 文档的 .doc。如果类型列为 NULL,则将该文档视为文本文件。说明  若要建立全文索引,文档的大小必须小于 16 兆字节 (MB),并且不能包含超过 256 千字节 (KB) 的筛选文本。
    文档类型列可通过下列方式创建:在全文索引向导中,如果选择了一个 image 列用于索引,还必须同时指定一个 Binding column 列以存放文档类型。sp_fulltext_column 存储过程也接受列的参数以容纳文档类型。若要查看文档类型,请使用 sp_help_fulltext_columns 存储过程返回列名和列 ID。一旦 image 列被编入索引,即可使用检索谓词 CONTAINS 和 FREETEXT 对其进行查询。说明  筛选有可能处理嵌入父对象中的对象,这取决于其执行方式。筛选并不跟踪到其它对象的链接。
    可以创建自定义筛选用于其它文件类型的全文索引。有关创建自定义筛选的更多信息,请在 Microsoft Web 站点上 MSDN Library 的 Platform SDK 部分中搜索"custom filters"。