如何根据查询语句找出相关的文档？

小弟在学习并自己开发搜索引擎，现在做到了倒叙排列，网络爬虫。但是在查询的时候如何根据查询语句找出相关文档呢？在网上找了下，有个叫向量空间模型的，，但是解释不是很清楚。权重如何赋值？如何找到文档中的关键词？是根据词语出现的频率还是其他的？（明显“了”“的”这样的词出现频率会很多，但是不可能是关键词啊）请各位达人指点下。。