大家都知道对于数据库的数据可以用全文索引
但对于系统文件的检索呢?
此外对于各种类型,例如图纸,PPT,PDF类型的文件如何检索呢?
当然系统文件也可用SQLSERVER的检索引擎,但它支持类型太少,而且不方便.
大家在这方面有没有心得?可否讲一下? 最后一点,小生有个群,最近常讨论日益明朗和公开化的技术难点,有兴趣可以来一块探讨一下
还有八个名额满员!!!!
群号:28029937
但对于系统文件的检索呢?
此外对于各种类型,例如图纸,PPT,PDF类型的文件如何检索呢?
当然系统文件也可用SQLSERVER的检索引擎,但它支持类型太少,而且不方便.
大家在这方面有没有心得?可否讲一下? 最后一点,小生有个群,最近常讨论日益明朗和公开化的技术难点,有兴趣可以来一块探讨一下
还有八个名额满员!!!!
群号:28029937
主要是看你的东西适合用什么方法
对于图纸,PPT,PDF类型的文件
自己写一个数组
把这些文件的后缀添加进去
或者你可以在界面留一个接口
用户想添加什么类型的文件都可以,当然应支持汉语输入(比如图像文件,你就在后台添加.bmp、.jpg等等)
dwg文件格式很复杂,
做到检索很困难
但是其中的文字信息还是比较容易解析的
网上有这样的文章
甚至可以考虑转化成dxf
www.codeproject.com/csharp/winsearchfile.asp
http://developerland.com/DotNet/Enterprise/340.aspx
http://www.eggheadcafe.com/articles/20010422.asp
http://developerland.com/DotNet/Enterprise/340.aspx
的介绍,参看文章的“Which files is Indexing Server capable of indexing?”这个部分
* query.dll - Filters files with the TXT, ASM, BAT, C, CPP, CXX, CMD, DEF, DIC, H, HPP and XML extensions. These are all read as plain text files.
* nlhtml.dll - Filters files with the ASCX, ASP, ASPX, CSS, HHC, HTA, HTM, HTML, HHT, HTW, HTX, ODC and STM extension. These are all files which contain or render HTML content.
* offfile.dll - Filters files with the DOC, DOT, POT, PPS, PPT, XLB, XLC, XLS and XLT extension. All these files are MS Office files.
* mimefilt.dll - Filters files with EML extension, which are MIME content.
* mspfilt.dll - Filters files with the TIFF extension. This filter gets installed by MS Office 2003.