我在配置单元中定义的外部表上使用sparksql时遇到了一个奇怪的问题 CREATE EXTERNAL TABLE ... STORED AS PARQUET... LOCATION 'hdfs://path/TABLENAME'
如果我在spark中用 spark.table("tablename")
或者 spark.sql("select column from tablename")
我得到了正确的行计数,但每个值都是空的。
当我通过beeline查询表时,我得到了正确的值。
另外,如果我直接用spark查询Parquet地板 spark.read.parquet("hdfs://path/TABLENAME")
我也得到了正确的答案。
更奇怪的是,如果我用类似的 CREATE EXTERNAL TABLE...
在hdfs中,sparksql可以工作。
我下一步该去哪里?
暂无答案!
目前还没有任何答案,快来回答吧!