按楼上的说法,百度和google都太可笑了,因为“和服务”是可以搜索出来的,中文分词很复杂目前还无法实现百分百的准确性中文分词技术属于自然语言处理技术范畴,是中文搜索引擎的核心技术,感兴趣的朋友可参考
http://www.stlchina.org/twiki/bin/view.pl/Main/SESegment
http://www.stlchina.org/twiki/bin/view.pl/Main/SESegment
解决方案 »
- 有关asp.net4.0 路由设置问题
- 超链接到根目录产生的404错误。
- asp.net后台管理(散分)
- 请问有没有带附件的新闻系统源码?
- windows应用程序中调用迅雷与Web应用程序调用迅雷的区别
- 求助:通过aspx页访问电子书,该书是光盘版,不是打包好的exe或其他类型的文件
- 分数不多啦,问个刷新问题
- 高手帮我看看我这个递归显示树菜单的函数有什么问题啊?不知道我有没有描述清楚,谢谢了
- 如何彻底清除asp、htm网页被定期嵌入“<script src=http://www.suoe.com.cn/inc/wy.js>”代码
- 非常急!
- 一个对齐的小问题
- GridView中两个联动DropDownList不激发事件?
这个问题到此为止,如果你觉得你够牛去和google的开发组讨论,我不是高手不愿意和你纠缠
如果你用这个扩大搜索范围功能来歪曲我的正常搜索的意思,那么你就太过于急于抬杠了。
这个问题到此为止,如果你觉得你够牛去和google的开发组讨论,我不是高手不愿意和你纠缠google开发组就很厉害吗?各有专长吧。
相对而言,目前分词已经做的不错了,再进一步,就是机器能识别语义了,但还要不短的时间才可能实现吧。
先有个初始化词表
然后派蜘蛛去抓网页
抓回来的网页通过索引方式保存
索引算法比较常用的如:Lucene倒排索引
然后如果用户搜索就从这些索引中获取到网页信息而且一旦用户搜索,就可以从用户的输入数据中获取新的分词,放到原有的词表中这样就可以进一步扩大搜索精度和广度
http://www.cs-open.com/sort/23.html
--------------
微软的苏鹏?sp?不是吧?
不是苏鹏那也是高手,看看星星就知道了
sisoxy(行风)
搜索引擎的查询并不是一次把所有结果显示出来.
而是在翻页的时候重新查询一次.
而且查询的速度在1秒之内.因为所有的数据都会被做成索引,经过优化可他还有赞助商啊 能瞬间将其显示到首页页不容易阿