想把spark sql 的结果dataframe保存为csv到本地文件系统。但是集群上运行,只会在master那台机器的给定目录下生成_SUCESS文件,而真正的csv文件好像会随机生成在集群的其他机器上面。有没有办法指定这个文件的生成位置?起码能确定csv文件会在哪个机器上生成?
想把spark sql 的结果dataframe保存为csv到本地文件系统。但是集群上运行,只会在master那台机器的给定目录下生成_SUCESS文件,而真正的csv文件好像会随机生成在集群的其他机器上面。有没有办法指定这个文件的生成位置?起码能确定csv文件会在哪个机器上生成?
解决方案 »
免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货