各位大大好,小弟现在正被一个严重的问题困扰着,望大大们能给予帮助,谢谢。公司目前做一个网页分析系统,所有的页面信息都是存在数据库中的,由于开发初期数据库设计不够好,导致现在的问题。
目前主要数据库表结构是所有的网页页面信息存在一张表Table_web里面的(35+列、html源代码,url,从源代码分析出的数据...),这样导致随着数据量的增加,表table_web空间增加很快(目前数据150W,DB大小60G,table_web 55G),另外致命的是所有的业务逻辑都是操作表Table_web(对URL的下载,对html源码的分析,分析结果的存储,数据统计,UI显示),这样可想而知。
我知道这样的结构各位肯定受不了,我也受不了,但是公司同组成员坚定说这样对数据查询没有影响,我也就没法说了。大大们 该怎么办...谢谢 

解决方案 »

  1.   

    其实 我现在的想法是各业务分开建表
    Tabla_a(主要针对下载使用)、table_b(针对分析模块使用),table_c(针对UI),a、b、c表由ID关联
    A表主要存URL等数据,现在模块下载a表的url,得到的源码插入b表,对a表下载的url标记。
    B表(空间仍然很大,但设计的模块单独)其实就就是一个html仓库,分析模块对B的数据进行分析,存入A、C表。
    C表就是分析后的数据,供UI显示。不知道这个想法如何,谢谢。
      

  2.   

    ,但是公司同组成员坚定说这样对数据查询没有影响,我也就没法说了。撤退 换JOB