比如有1000万的数据量,要对其中数据进行抽样检查,校验数据的质量,抽样量的大小有没有一个科学或者有权威性的说明?
比如只需要抽样多少条数据就能确定一个质量的范围?

解决方案 »

  1.   

    不明白抽样检查数据目的,具体的质量范围是什么该概念。
    还是主要验证数据负载、现在性能状况,还是..
      

  2.   

    因为数据量过大,数据也由客户方提供的,客户不希望把全部数据提供出来,因此采用抽样检查。
      

  3.   

    抽样频率,这个和业务有关系吧,你按照客户的标准来做,一般都是百分比或者千分比来进行的,
    例如抽样率要达到百分之多少,这样就可以了
      

  4.   

    这个抽样大小由我们来定的,之前学过概率论,都忘了。