所以,我在spark中使用amazon deequ,我有一个Dataframe df
有一列 publish_date
哪种类型的 DateType
. 我只想检查一下:
publish_date <= current_date(minus)x AND publish_date >= current_date(minus)y
哪里 x
以及 y
是整数。
我不知道在这里放什么支票:
val verificationResult: VerificationResult = { VerificationSuite()
.onData(df)
.addCheck(
Check(CheckLevel.Error, "Review Check")
//function to check this
)
.run()
}
1条答案
按热度按时间w8rqjzmb1#
可以使用以下spark sql表达式:
用check的方法:
或使用
between
: