我有一个定制的函数,它看起来像这样,返回一个不同的Dataframe作为输出
def customizedfun(data : DataFrame, param1 : Boolean, param2 : string) : DataFrame = {...}
我想把这个函数应用到每一组
df.groupBy("type")
然后从每个 type
一个Dataframe。
这与有关将自定义函数应用于分组Dataframe的其他问题稍有不同,因为除了所讨论的Dataframe之外,此函数还接受其他输入 df.groupBy("type")
.
最好的办法是什么?
1条答案
按热度按时间piztneat1#
你可以过滤掉原稿
df
给不同的小组打电话customizedfun
然后将结果合并。我想
customizedfun
是一个简单地将两个参数添加为新列的函数,但它可以是任何函数:我需要两个助手函数来计算
param1
以及param2
取决于type
. 在实际应用程序中,这些函数可以是字典的查找。现在是原来的
df
被分成不同的组,customizedfun
调用并合并结果: