请问一个算法问题

如果已知一个聚类，这个聚类是由n个样本组成的，并且已知该聚类的聚类中心，半径（方差），但不知道具体的样本，现在想从这个聚类中采集m(m < n)个样本使得采集的样本充分离散，并且尽可能符合原始样本的特征（比如假设原始样本是二维的，第一维大于第二维），请问如何采样，或者还需要哪些信息才可以达到目的？谢谢了！

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

算法问题，去高性能web开发版块，那里算法牛人多。
你说的术语一个也不懂。
网上抄了一个，反正我是看不懂，不知道楼主能否有启发。哈哈。
　k-means 算法接受输入量 k ；然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足：同一聚类中的对象相似度较高；而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”（引力中心）来进行计算的。
　　k-means 算法的工作过程说明如下：首先从n个数据对象任意选择 k 个对象作为初始聚类中心；而对于所剩下其它对象，则根据它们与这些聚类中心的相似度（距离），分别将它们分配给与其最相似的（聚类中心所代表的）聚类；然后再计算每个所获新聚类的聚类中心（该聚类中所有对象的均值）；不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类具有以下特点：各聚类本身尽可能的紧凑，而各聚类之间尽可能的分开。