如题!
自己想写个浏览器,实现对搜索结果的二次搜索,
实现:自己想要的内容比较考前显示?
大家给个建议?
万分谢谢!!

解决方案 »

  1.   

    读html代码
    通过html标记去获得所有的结果
    然后存到一个数组或者其他数据结构中就行咯
      

  2.   

    以百度
    通过xml方式去读百度搜索结果页面
    然后把结果一条一条存到你的地方就行了
      

  3.   

    先通过百度或者Google搜索,得到结果解析到搜索到的有用数据,然后根据你要的条件进行筛选~
    仅此思路,UP、、、、、[align=center]********************************************************
    欢迎使用 CSDN 小秘书
    每天回帖即可获得10分可用分!
    ********************************************************
    [/align]
      

  4.   

    加载词典(你设定的一些词并有唯一的对应数字编码)
    加载存储文件(你存储临时临时扫描结果的数据)
    从搜索引擎获取数据(建议使用win32的socket,多线程)存储到临时索引表和临时内容表,规则如下
    每次扫描上次分析后的n条数据。分析的时候根据页面的内容取掉所有连接,然后分析是否具有图片,如果具有大图片则只取大图片的alt,去掉所有html符号,剩余的数据通过递归和你的字典分析,出现概率最多的 你就排索引表前面。
    越用越精准,你要不停的修正你的字典。 字典不是简单的词组合 是你要根据你的具体需求进行设立的。
    最好学学一些搜索算法