1 我使用中科院的分词系统 进行分词。
2 把分词结果按照:例:深圳市 可 搜 网络 技术有限公司,请注意,空格表示分隔。
3 把结果按照 两个词相邻保存和三个词相邻保存,如果相邻的是单个字,则看成一个词。
4 数据库使用Sqlserver2000 建了一个表 Search ,字段有
id
Title
AddDate这是基本思路,下班了,回家再写。。有经验的兄弟们也提点建议,感谢。。
2 把分词结果按照:例:深圳市 可 搜 网络 技术有限公司,请注意,空格表示分隔。
3 把结果按照 两个词相邻保存和三个词相邻保存,如果相邻的是单个字,则看成一个词。
4 数据库使用Sqlserver2000 建了一个表 Search ,字段有
id
Title
AddDate这是基本思路,下班了,回家再写。。有经验的兄弟们也提点建议,感谢。。
我看过lucene.net 主要是
建立索引
分词
然后检索索引
不连接数据库。
今天继续 改进了一下:
1 我使用中科院的分词系统 进行分词。
2 把分词结果按照:例:深圳市 可 搜 网络 技术有限公司,请注意,空格表示分隔。
3 把结果按照 三个词相邻保存,如果相邻的是单个字,则看成一个词。
4 如果用户输入的汉字长度小于4个汉字,不使用分词。
5 数据库使用Sqlserver2000 建了一个表 Search ,字段有
id
Title
AddDate
6 对Title和AddDate 复合索引,日期降序。-------------------改进中