我想用y或n填充一个新的列。为此,我检查两列,如果其中一列的值为真,我在新列中输入y,否则输入n。
例如,我有一个Dataframe:
+--------------+----------+----------+------------------+--------+--------+-------------------+
|Date |Col1 | Col2 |ChangeinCol1_Col2 | Col3 | Col4 | ChangeinCol3_Col4 |
+--------------+----------+----------+------------------+--------+--------+-------------------+
|2020-12-14 |True | False | Y | False | False | N |
|2020-12-14 |False | False | Y | False | False | N |
如果col1或col2中有true,则changeincol1\u col2列将是y,changeincol3\u col4也是y,但在这种情况下有n,因为col3和col4中没有更改。
在scala中如何使用apache spark?我尝试用df.withcolumn创建新列,但不知道如何检查cols中的值。
1条答案
按热度按时间ppcbkaq51#
你可以用
when
: