Mark下,希望有人分析好的思路,,,,,,,

解决方案 »

  1.   

    这个貌似搜索引擎的核心技术。
    我觉得应该是多个排序的sql语句,然后用union将结果合并到一个记录集
      

  2.   

    这个好像挺复杂的。不知道google他们如何做。设想:
    首先分词
    有各种分解可能,给对应的分解出的词加上一个权值,
    根据搜索结果根据对应权值,算出一个优先值来,根据这个值排序。比如:
    中国人 (没切割,自然权值最高)  权--100
    中国  -50   人 10
    中    -10   国人  40
    中- 10   国 -10  -- 人 -10
    1.中国人民站起来                  100
    2.站在中间的那个美国人出来一下    10 + 40 = 50
    3.关系还在发展中                  10 
    4.我们的祖国真伟大                10
    5.人们在扫雪                      10这样大致排序,词的权值根据词的长度和词的使用程度定。
    比如认为“中国”比“国人”高,因为“中国”更常见。大概想法,欢迎进一步讨论