我在我的dataframe中有这个表,char
列要么只包含字母,要么只包含数字,要么只包含字母和数字的组合。
char count
123 24
test 25
te123 26
test123 26
我想只提取字母,如果行只有数字,那么我想让它为空。
预期结果将是:
char count
NaN 24
test 25
te 26
test 26
在python中我怎么能做到这一点呢?
先谢谢你了
3条答案
按热度按时间7uhlpewt1#
您可以使用
extract
:如果有像
"te12s3t"
这样的间断字符,请使用findall
:或者简单地使用
replace
来处理 * 这两种情况 *:或者以@Corralien 的方式,使用
isdigit
和replace:输出:
5sxhfpxr2#
你可以使用regex来做这件事。
这里
re.sub('[^a-zA-Z]+', '', x)
从字符串中删除所有非字母字符,下一个正则表达式bool(re.search('[a-zA-Z]', x))
检查结果字符串是否包含字母,否则将其变为NaN。vi4fp9gy3#
我们可以按如下方式使用
str.replace
: