我有一个数据集,在其中一列中,我有像'1-M3 [J]'和'1 - M3 [J]'这样的值。两者是相同的值,但增加了一个空格。这种情况下数据不一致。我用的是:
'1-M3 [J]'
'1 - M3 [J]'
Split(column,'[-]')[0]
这将只给出一次值1给予。Split(column,'[ - ]')[0],这将给予仅1个值。我期待这两个值被检索,我请求你的帮助,使用连接条件修剪?预期输出为:1,1
Split(column,'[ - ]')[0]
6pp0gazn1#
使用REPLACE将多余的空格替换为空白“”,然后在join中使用它。
REPLACE
REPLACE(Column1, " ", "")
wqlqzqxt2#
您可以使用以下功能块:
import redata = ['1-M3[J]', '1-M3[J]']number = []for item in data: match = re.findall(r'\d+', item) if match: number.extend(match)number = [int(num) for num in number]print(number)
import re
data = ['1-M3[J]', '1-M3[J]']
number = []
for item in data:
match = re.findall(r'\d+', item)
if match:
number.extend(match)
number = [int(num) for num in number]
print(number)
2条答案
按热度按时间6pp0gazn1#
使用
REPLACE
将多余的空格替换为空白“”,然后在join中使用它。wqlqzqxt2#
您可以使用以下功能块: