spark配置单元代理密钥

ubby3x7f  于 2021-06-26  发布在  Hive
关注(0)|答案(0)|浏览(177)

我有一个如下的Dataframe

+--------+-----+-------+-------------+----+
| movieID|Title|  genre|      row_key|TEST|
+--------+-----+-------+-------------+----+
|56053970|    3|6069358| PYME (otros)|   0|
|76076916|    9|7931718| PYME (otros)|   0|
| 9262542|    7|2572351| PYME (otros)|   0|
| 5356903|    K| 752733| PYME (otros)|   0|
| 5632710|    K| 852839|Independiente|   0|
|77725450|    2|5805474| PYME (otros)|   0|
+--------+-----+-------+-------------+----+

现在,我的要求是添加一个id不断增加的列,比如说像传统rdbms中的代理键一样
现在如果我添加id递增的列。下一次当我再次重新加载这个Dataframe时,我需要增加并插入获取max id。
我怎样才能做到这一点?
我试过很多方法。
但我怎样才能做到这一点呢?

暂无答案!

目前还没有任何答案,快来回答吧!

相关问题