sql—如何在spark scala中将配置单元表的表统计信息转换为Dataframe

pvcm50d1  于 2021-06-27  发布在  Hive
关注(0)|答案(2)|浏览(281)

我在sparkscala上做一个项目,我能把配置单元表的表统计信息放到数据框中进行进一步的计算吗?
我可以使用
“显示表统计信息表名称”
但我能把这些信息放到数据框里吗。谢谢

mwyxok5s

mwyxok5s1#

我觉得这就够了。

val df = spark.sql("show table stats table_name")

但是,我的表统计测试不起作用。我用了一个 ANALYZE 以及 DESCRIBE EXTENDED 为了考试。

spark.sql("analyze table table_name compute statistics")
val df = spark.sql("describe extended table_name")
df.show(false)

这就产生了一个结果。

olqngx59

olqngx592#

在spark2中,可以通过以下方法之一将配置单元表数据导入Dataframe:
方法1:

val df = spark.sql("select * from databasename.tablename")

方法2:

val df = spark.read.table("databasename.tablename")

相关问题