说的简单,怎么记啊? 要是记到一个表里,就是百亿的记录,要么就建6万个表,不过这个方法也太不可扩充了吧? MSDN 是怎么做的呢???

解决方案 »

  1.   

    采用字典法,如果是英文词汇的话,就按字典顺序排列词汇,词汇后紧跟句子。
    如:program:
       程序,编程再用二分法定位(如果不知道二分法,就看数据结构书,其实查字典的方法).如果是中文词汇的话,可以考虑用国家中文编码表作排列。
      

  2.   

    可是一个句子里可能包含多个词汇,那样3G的空间岂不就变成3*nG空间??就算n=5,那也是15G啊,冗余太大了吧? 我就算是记录位置字节数,也会使记录庞大到不可接受的程度!  我想 MSDN 中的检索,一定不是这样做的。