我用的是Spark壳1.6。我想执行一个检查,将所有包含空值的行与不包含空值的行分开。更确切地说,我必须将它们分为两个不同的表(数据和错误)。问题是我有太多的列(42),所以一次检查一列是不可能的。以下几点可能会有所帮助:
数据的模式包含bigint、int、string和date格式。
使用的表都是配置单元表。
我也有csv的数据(但使用sparkshell是必须的)。
我用的是Spark壳1.6。我想执行一个检查,将所有包含空值的行与不包含空值的行分开。更确切地说,我必须将它们分为两个不同的表(数据和错误)。问题是我有太多的列(42),所以一次检查一列是不可能的。以下几点可能会有所帮助:
数据的模式包含bigint、int、string和date格式。
使用的表都是配置单元表。
我也有csv的数据(但使用sparkshell是必须的)。
1条答案
按热度按时间bnlyeluc1#