我有一个问题:我将排序(按特定键,如时间戳)数据写入hdfs到多个文件中(每个文件约70gb,数据已排序)。我想看Flink的档案。但我必须确保数据的排序(跨文件)。我的问题是:flink如何从hdfs读取文件?它是一个文件一个文件地读取还是按每个文件的块随机读取?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!