优化计划的数据集大小返回的数字太大

7dl7o3gd 于 2021-05-27 发布在 Spark

关注(0)|答案(0)|浏览(264)

我有一个小的数据集，当写为Parquet时，它占用82kb。
我正试图用下面的命令预先计算数据集的大小。

BigInt original Size = SparkUtility.sparkSession().sessionState().executePlan(dataSet.queryExecution().logical()).optimizedPlan().stats().sizeInBytes();

这里的问题是它太大了，例如它返回1553303854747465490（1e）。有人能解释我做错了什么吗？。我希望值应该是82000（字节）

apache-spark java-8

来源：https://stackoverflow.com/questions/63845465/dataset-size-with-optimized-plan-is-returning-way-too-big-number

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

优化计划的数据集大小返回的数字太大

暂无答案！

相关问题

热门标签

最新问答