如题,就是多个节点都能访问到,然后都能去更新这个变量,更新完以后,其他节点访问 也是最新值,spark有这种解决方案吗?共享变量是只读的,貌似做不到
解决方案 »
- openstack-nova-metadata-api服务起不来,无法SSH
- openstack网络配置
- 推荐两篇外文译文,非常受益!
- openstak havana dashboard问题求助
- 提问:能否从EC2的外部访问ElastiCache
- Sqooop2创建mysql连接时出现了问题
- spark如何解析还有内嵌的json
- 想用Spark实现一个MLlib没有的机器学习算法?
- 请问如何使用DataFrame实现以下逻辑?
- hbase存储设计问题
- docker 运行container时使用--net=host,如何连到container
- cloudera hue创建oozie workflow跑pyspark程序方法
而累加器则是Driver只读,Executor只写的对象。
因此你只能通过数据库或者HDFS文件等来做数据实时共享了,封装好访问的方法在算子里面访问,注意读写锁问题。
推荐一个库menagerie,实现了分布式锁,Leader选举,以及实现了java.util.concurrent包下的并发集合接口的分布式实现