我有一个包含多列的数据集,并且我有以下列需要将其分隔为新列,下面是我拥有的数据集的示例:
使用Python,我的目标是将一个字符子集到单独的列中,以便能够处理数字作为表示日期的字符之后的前6个数字,如(220519)2022/05/19,其他值也是如此,因此,我预计我在 Dataframe 中的最终输出为:
nr7wwzry1#
IIUC,您可以使用:
df[['y', 'z']] = df['x'].str.extract(r'(\D+)(\d{6})')
如果要排除y中的第一个字母,请使用:
df[['y', 'z']] = df['x'].str.extract(r'.(\D+)(\d{6})')
1条答案
按热度按时间nr7wwzry1#
IIUC,您可以使用:
如果要排除y中的第一个字母,请使用: