我正在使用 hive
查询分区为的数据 instance/year/month/day
居住在 s3
.
对于给定的分区 instance='new'/year=2017/month=5/day=1
存在多个压缩为.tsv.gz的文件。其中一些文件可能已损坏或已损坏 0 B
在任何给定的时间点。
当我查询建立在它上面的表时,我得到以下错误, Unexpected end of input stream error.Vertex failed
有没有办法只查询大小大于0或未通过配置单元损坏的文件?
谢谢。
杰泽
暂无答案!
目前还没有任何答案,快来回答吧!