有多个hadoop集群,各集群的hadoop版本一致,这几个hadoop集群可能分布在不同地域。
1、要求能在其中一个集群的管理端看到其他集群的节点信息,比如hdfs的文件目录信息等。
2、要求在其中任意节点下发MR(或hive,spark)作业,在数据所在的集群执行此MR(或hive,spark)作业,也就是在数据所在集群执行作业。
请各位帮忙提供一些建议或者解决思路,谢谢啦!