hive 如何在连接条件下使用trim函数?

6kkfgxo0  于 2023-10-18  发布在  Hive
关注(0)|答案(2)|浏览(177)

我有一个数据集,在其中一列中,我有像'1-M3 [J]''1 - M3 [J]'这样的值。两者是相同的值,但增加了一个空格。这种情况下数据不一致。
我用的是:

  1. Split(column,'[-]')[0]

这将只给出一次值1给予。
Split(column,'[ - ]')[0],这将给予仅1个值。
我期待这两个值被检索,我请求你的帮助,使用连接条件修剪?
预期输出为:1,1

6pp0gazn

6pp0gazn1#

使用REPLACE将多余的空格替换为空白“”,然后在join中使用它。

  1. REPLACE(Column1, " ", "")
wqlqzqxt

wqlqzqxt2#

您可以使用以下功能块:

  1. import re
  2. data = ['1-M3[J]', '1-M3[J]']
  3. number = []
  4. for item in data:
  5. match = re.findall(r'\d+', item)
  6. if match:
  7. number.extend(match)
  8. number = [int(num) for num in number]
  9. print(number)

相关问题