各位大牛们,我现在有这样一个问题,我从redis中取数据,redis中的数据是安partition存储的,我需要让不同patition中的数据在各自的partition中分别处理,应该如何做啊。应该如何处理呢?
解决方案 »
- OpenStack两岁生日,你想对他说点什么呢?
- 如何给instance分配能访问外网的ip呢
- 我要为S3对于我的Glacier的保管库存储的数据的服务付费吗?
- Spark读取Hdfs
- 一段scala代码读不懂。。。
- Microsoft Ignite China微软技术大会——投票及黑科技讨论活动获奖名单公布!
- ixgbevf: Unable to start - perhaps the PF Driver isn't up yet
- spark filter 过滤
- spark cache问题
- python小白求助
- hp服务器报错提示,求解决
- 如何成为一名大数据相关的从业者??望有大神带路,谢谢。
例如rdd.foreachPartition(new VoidFunction<Iterator<String>>() { @Override
public void call(Iterator<String> it) throws Exception {
if( xxxxx ) { // 条件。比如遍历该分区的数据去取某个特征
new RealForeachPartitionFunc1().call(it); // 执行真正的foreachPartition算子
} else {
new RealForeachPartitionFunc2().call(it);
}
}
});
override def numPartitions: Int = ??? override def getPartition(key: Any): Int = {
/*redis中的分区规则*/
}
}