给大家上堂课,一个简单而又让无数想做搜索的程序员心动的课,看完只要不是傻子都能自己开发搜索引擎了
http://hi.baidu.com/earthsearch去看看吧,看完只要不是傻子都能自己开发搜索引擎了百万商业圈 版权所有,未经许可不得转载!作者 QQ 99923309
http://hi.baidu.com/earthsearch去看看吧,看完只要不是傻子都能自己开发搜索引擎了百万商业圈 版权所有,未经许可不得转载!作者 QQ 99923309
-----------------------------------
来给大家上堂课,一个简单而又让无数想做搜索的程序员心动的课为什么搜索引擎的查询速度这么快?
说明白了很简单,核心技术就是 “倒排索引”。
“倒排索引”这个名词很唬人,其实原理很简单。
假设有3篇文章,file1,file2,file3,
文件内容如下: file1 (单词1,单词2,单词3,单词4....)
file2 (单词a,单词b,单词c,单词d....)
file3 (单词1,单词a,单词3,单词d....)
建立的倒排索引就是这个样子:
单词1 (file1,file3)
单词2 (file1)
单词3 (file1,file3)
单词a (file2, file3) ....
这就是倒排索引,很简单吧,你心动吗?很简单吧,你心动吗?
心动就赶紧行动吧这些都是我自己凭空想出来的,对不对还不知道哈这还只是单级索引,现在主要靠多级索引多级索引我以后在给大家讲我的想法!以上内容4年前由本人完全凭空想象出来的,未参考任何前人的书籍和作品,任何人都可以无偿使用!百万商业圈 版权所有,未经许可不得转载!作者 QQ 99923309