当前位置:   article > 正文

spark cache (几种缓存方法)_spark sql的cache方法

spark sql的cache方法
  1. sql语句中cache
	//缓存全表
	sqlContext.sql("CACHE TABLE activity")
	//缓存过滤结果
	sqlContext.sql("CACHE TABLE activity_cached as select * from activity where ...")
	//取消缓存
	sqlContext.sql("UNCACHE TABLE activity")
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

CACHE TABLE是即时生效(eager)的,如果你想等到一个action操作再缓存数据可以使用CACHE LAZY TABLE,这样操作会直到一个action操作才被触发,例如count(*)

  1. dataframe的api
	df.cache
	df.unpersist
  • 1
  • 2

3.SQLContext的api

	SparkSession.sqlContext.cacheTable("XXX")
	SparkSession.sqlContext.unCacheTable("XXX")
  • 1
  • 2

实际调用的是sparkSession.catalog.(un)cacheTable

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/木道寻08/article/detail/734895
推荐阅读
相关标签
  

闽ICP备14008679号