下面是Spark DataFrame:
+---+---+
| a| b|
+---+---+
| 1| 1|
| 1| 2|
| 1| 3|
| 1| 4|
+---+---+
我想创建另一个名为"c"
的列,其中包含“B”与“a”的乘积。生成的DataFrame应该如下所示:
+---+---+---+
| a| b| c|
+---+---+---+
| 1| 1| 1|
| 1| 2| 2|
| 1| 3| 6|
| 1| 4| 24|
+---+---+---+
如何做到这一点?
4条答案
按热度按时间pjngdqdw1#
下面是一种不使用用户定义函数的替代方法
如果你真的不在乎精度,你可以建立一个更短的版本,
p8ekf7hl2#
你必须设置一个命令栏。在你的例子中,我用了“B”栏
pwuypxnk3#
nqwrtyyt4#
你的回答与此类似。