regex 从 Dataframe 列提取格式日期

zvms9eto  于 2022-11-26  发布在  其他
关注(0)|答案(2)|浏览(136)

我在python中有一个包含各种日期的 Dataframe 。

df = pd.DataFrame({"Date":["2020-01-27 welcome ! offer","Space ! offer 2020-02-27","new | 2020-03-27"],
                   "A_item":[2, 8, 0],
                   "B_item":[1, 7, 10],
                   "C_item":[9, 2, 9],

                   })

我需要得到这个结果
| 日期|项目(_I)|B项目(_I)|C项目(_I)|提取日期|
| - -|- -|- -|- -|- -|
| 2020-01-27欢迎光临!优惠|2个|一个|九个|2020年1月27日|
| 太空!优惠活动2020-02-27|八个|七个|2个|2020年2月27日|
| 太空!优惠新品2020-03-27|第0页|10个|九个|2020年3月27日|
有人知道怎么把它们取出来吗

eoigrqb6

eoigrqb61#

您可以尝试以下代码:

def extract_date(x):
    pattern = "[0-9]+-[0-9]+-[0-9]+"
    match = re.findall(pattern, x)
    return match[0]

df["new_column"] = df["first_colum"].apply(extract_date)

first_column是来源数据行。
然后,您应该会得到以下输出:

gcuhipw9

gcuhipw92#

df['Extracted Date']=df['Date'].str.extract(r'([\d]{2}-[\d]{2}-[\d]{4})|\)')

相关问题