我有以下 Dataframe :
d_test = {
'c1' : ['31', '421', 'sgdsgd', '523.3'],
'c2' : ['41', np.nan, '412', '412'],
'test': [1,2,3,4],
}
df_test = pd.DataFrame(d_test)
我想把所有非浮点值替换为np.nan
:
0 31 41 1
1 421 NaN 2
2 NaN 412 3
3 523.3 412 4
我是这样做:
df_test[['c1', 'c2']] = df_test[['c1', 'c2']].replace(to_replace=r'^[+-]?([0-9]+([.][0-9]*)?|[.][0-9]+)$', value=np.nan, regex=True)
但结果却不是我所期待的:
0 NaN NaN 1
1 NaN NaN 2
2 sgdsgd NaN 3
3 NaN NaN 4
1条答案
按热度按时间wz8daaqr1#
IIUC,可以将
pandas.to_numeric
与errors="coerce"
一起使用:错误{'ignore'、' raise '、' coorce'},预设值为'raise':
#输出: