我正试图在cdh5.14.2上运行带有配置单元的presto(下面所有版本的详细信息),令人惊讶的是,当我在任何表上运行任何select查询时,我得到了0条记录作为输出。当我在任何表上选择时,我只得到所有字段的列表,同样没有数据。所有的表都是带有Parquet格式数据的外部配置单元表
配置单元1.1.0
普雷斯托0.223,也是0.219
检查presto installation中的server.log文件,没有错误或警告消息
也尝试了同样的安装与普雷斯托0.219,同样的情况
presto:sample_db>从tablename中选择count();
_col0
-------
0
(1 row)
Query 20190925_125900_00005_8tzp2, FINISHED, 1 node
Splits: 18 total, 18 done (100.00%)
0:01 [0 rows, 0B] [0 rows/s, 0B/s]
描述格式化tablename的输出--
# col_name data_type comment
column1 string
column2 string
column3 string
column4 decimal(6,0)
column5 timestamp
# Partition Information
# col_name data_type comment
active string
# Detailed Table Information
Database: db_name
Owner: cloudera-vivek
CreateTime: Sun Nov 25 03:23:06 GMT 2018
LastAccessTime: UNKNOWN
Protect Mode: None
Retention: 0
Location: dtap://dbname/tablename
Table Type: EXTERNAL_TABLE
Table Parameters:
EXTERNAL TRUE
STATS_GENERATED_VIA_STATS_TASK true
numPartitions 2
numRows 4142
transient_lastDdlTime 1543116186
# Storage Information
SerDe Library: org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe
InputFormat: org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat
OutputFormat: org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat
Compressed: No
Num Buckets: -1
Bucket Columns: []
Sort Columns: []
Storage Desc Params:
serialization.format 1
Time taken: 0.919 seconds, Fetched: 40 row(s)
这可能是因为hive和presto之间的版本不匹配吗?我在presto发行说明中找不到类似的东西,安装时需要添加的任何其他.jar或配置文件?
非常感谢你的帮助
1条答案
按热度按时间kfgdxczn1#
是否可以尝试使用此处提到的msck修复表名称:https://github.com/prestodb/presto/issues/4109 ?