我试图在数字源数据区域通过数据流时为其分配四分位数。我认为这可以通过在窗口转换中使用ntile表达式来实现。我试图使用这里提供的文档来获得任何成功,但失败了。这只是在将其用于实际应用程序之前了解实现的一个基本尝试。我在源数据集中有一个数值,我希望该范围内的值分布在4个桶中并按此定义。提前感谢您对此的任何帮助。
ercv8c1e1#
在数据流的Window转换中,我们可以配置“排序”选项卡中保留源数据数值列的设置,如下所示:
接下来,在窗口列选项卡中,创建一个新列,并将表达式写为“nTile(4)”,以便创建4个桶:
在“数据预览”中,我们可以看到数据分布在4个Bucket中:
1条答案
按热度按时间ercv8c1e1#
在数据流的Window转换中,我们可以配置“排序”选项卡中保留源数据数值列的设置,如下所示:
接下来,在窗口列选项卡中,创建一个新列,并将表达式写为“nTile(4)”,以便创建4个桶:
在“数据预览”中,我们可以看到数据分布在4个Bucket中: