从hive中读取数据然后进行cachevar data = spark.sql("select * from a").cachedata.show 第一次后面的计算中对a表进行了修改这个时候的
data.show 第二次
和之前的是一样的吗?
因为目前做的感觉这个data虽然cache了,但是数据源变了,data又重新计算,第一次和第二次的结果不一样,cache并没有成功的样子。这样可以让data保持不变,尽管数据源变了。
data.show 第二次
和之前的是一样的吗?
因为目前做的感觉这个data虽然cache了,但是数据源变了,data又重新计算,第一次和第二次的结果不一样,cache并没有成功的样子。这样可以让data保持不变,尽管数据源变了。
解决方案 »
免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货