sas中的nodupkey与sql中的select*distinct from table\ u name之间的差异

qmb5sa22  于 2021-06-26  发布在  Hive
关注(0)|答案(1)|浏览(781)

我有一个数据集,有两个字段存储字符串。1.在sas中,当我对数据集执行nodupkey操作时,我得到大约200条记录。2.在sql中,当我执行select distinct/group by/partition by时,我将获得约2000条记录。此sql代码在托管在aws emr服务器上的配置单元上运行。
我正在处理的数据集在某些字段的记录中为空。除了我在第1点和第2点提到的以外,我没有做任何其他事情。
我正在寻找解释,为什么有一个巨大的不匹配这两个当我只是做一个简单的重复删除。

gt0wga4j

gt0wga4j1#

distinct对select语句中的所有字段都进行操作,数据库可能会认为NULL和空白是不同的。sas不认为nulls和blanks是不同的,只考虑基于by语句中列出的变量的过滤器。

相关问题