没有 ORDER BY 订单不能保证。 数据被许多进程(Map器)并行读取,在计算分割后,每个进程开始读取一些文件或几个文件,具体取决于计算的分割。 所有的并行进程都可以处理不同数量的数据并在不同的节点上运行,每次的负载都不一样,所以它们开始返回行并在不同的时间结束,这取决于太多的因素,比如节点负载、网络负载、每个进程的数据量等等。 去除所有这些因素可以提高订单预测的准确性。也就是说,单线程顺序文件读取可能会返回与文件中相同顺序的行。但这不是数据库的工作方式。 同样根据codd的关系理论,列和行的顺序是无关紧要的。
1条答案
按热度按时间5fjcxozz1#
没有
ORDER BY
订单不能保证。数据被许多进程(Map器)并行读取,在计算分割后,每个进程开始读取一些文件或几个文件,具体取决于计算的分割。
所有的并行进程都可以处理不同数量的数据并在不同的节点上运行,每次的负载都不一样,所以它们开始返回行并在不同的时间结束,这取决于太多的因素,比如节点负载、网络负载、每个进程的数据量等等。
去除所有这些因素可以提高订单预测的准确性。也就是说,单线程顺序文件读取可能会返回与文件中相同顺序的行。但这不是数据库的工作方式。
同样根据codd的关系理论,列和行的顺序是无关紧要的。