创建索引:
CREATE INDEX myindex
    ON dmdocinfoindexpdf (urlpath ) INDEXTYPE IS CTXSYS.CONTEXT PARAMETERS ('
    DATASTORE CTXSYS.URL_PREF LEXER CTXSYS.chinese_LEXER SECTION 
    GROUP  CTXSYS.auto_SECTION_GROUP FILTER CTXSYS.null_FILTER ')
dmdocinfoindexpdf 表中有一条记录 是.pdf格式的文件路径
  查询dr$myindex$i  表
  token_text字段乱码我试过了几乎所有的FILTER、LEXER 和SECTION GROUP 了 可是还是乱码那位高手指导指导 小弟

解决方案 »

  1.   

    你的.PDF文件是中文名吧?改成英文名试试?
    应该是业务层的编码方式问题!
      

  2.   

    .PDF文件不是中文名,是英文和数字的,不知道那里原因,word文件不是乱码,只有.pdf文件是乱码。
      

  3.   

    DATASTORE CTXSYS.URL_PREF设置的不对吧.
    datastroe的属性值只能是如下几种(10gR2):
    DIRECT_DATASTORE
    MULTI_COLUMN_DATASTORE
    DETAIL_DATASTORE
    FILE_DATASTORE
    NESTED_DATASTORE
    URL_DATASTORE
    USER_DATASTORE
      

  4.   

    CTXSYS.URL_PREF  是自定义  的名称  其实 就是上边说的URL_DATASTORE  乱码 应该与  DATASTORE 无关吧   
      

  5.   

    你看看你的PDF是单层文件还是双层文件,ORACEL要把PDF的文字提取出来,有工具能将PDF单层转双层