#Populate a dummy table
df = pd.DataFrame(data=['chr6_GL','chr6_GL00','chr4','chr11','chr8','chr12'], columns=['Data'])
#Extract the numbers using regex and assign it to a new column called 'Number'
df['Numbers']=df['Data'].str.extract(r'chr([0-9]*)')
3条答案
按热度按时间cbwuti441#
使用
stringr
包和regex
你可以实现你正在寻找的,但你需要知道所有的可能性。也许如果你想要的和烦人的信息之间只有下划线,你可以使用str_split
和“_”作为模式参数来解决你的问题。字符串
gab6jxml2#
使用
data.table
软件包的解决方案:REPREX
字符串
型
型
创建于2021-10-12由reprex package(v2.0.1)
ca1c2owp3#
我已经创建了类似的列,并将数字提取到一个名为Number的新列:
字符串
数据编号