hive在选择数据时是否保持文件顺序

col17t5w  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(358)

如果我这样做了 select * from table1; 数据检索的顺序
文件顺序或随机顺序

5fjcxozz

5fjcxozz1#

没有 ORDER BY 订单不能保证。
数据被许多进程(Map器)并行读取,在计算分割后,每个进程开始读取一些文件或几个文件,具体取决于计算的分割。
所有的并行进程都可以处理不同数量的数据并在不同的节点上运行,每次的负载都不一样,所以它们开始返回行并在不同的时间结束,这取决于太多的因素,比如节点负载、网络负载、每个进程的数据量等等。
去除所有这些因素可以提高订单预测的准确性。也就是说,单线程顺序文件读取可能会返回与文件中相同顺序的行。但这不是数据库的工作方式。
同样根据codd的关系理论,列和行的顺序是无关紧要的。

相关问题