pandas 有没有办法在适当的位置创建一个Series.map，但在不匹配时保留原始值？

ndasle7k 于 2023-03-16 发布在其他

关注(0)|答案(2)|浏览(91)

这里的场景是，我有一个包含原始整数数据的 Dataframe df，以及一个将这些整数Map为字符串值的dict map_array。
我需要将 Dataframe 中的值替换为Map中的相应值，但如果它没有Map到任何内容，则保留原始值。
到目前为止，我能够弄清楚如何做我想做的事情的唯一方法是使用临时列。然而，考虑到我所处理的数据的大小，这有时可能会有点麻烦。因此，我想知道是否有一些技巧可以在Pandas中做到这一点，而不需要临时列...

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randint(1,5, size=(100,1)))
map_array = {1:'one', 2:'two', 4:'four'}

df['__temp__'] = df[0].map(map_array, na_action=None) 
#I've tried varying the na_action arg to no effect

nan_index = data['__temp__'][df['__temp__'].isnull() == True].index
df['__temp__'].ix[nan_index] = df[0].ix[nan_index]
df[0] = df['__temp__']
df = df.drop(['__temp__'], axis=1)

pandas

来源：https://stackoverflow.com/questions/19919891/is-there-a-way-to-do-a-series-map-in-place-but-keep-original-value-if-no-match

2条答案

按热度按时间

v6ylcynt1#

我认为您可以简单地使用.replace，无论是在DataFrame上还是在Series上：

>>> df = pd.DataFrame(np.random.randint(1,5, size=(3,3)))
>>> df
   0  1  2
0  3  4  3
1  2  1  2
2  4  2  3
>>> map_array = {1:'one', 2:'two', 4:'four'}
>>> df.replace(map_array)
      0     1    2
0     3  four    3
1   two   one  two
2  four   two    3
>>> df.replace(map_array, inplace=True)
>>> df
      0     1    2
0     3  four    3
1   two   one  two
2  four   two    3

不过，我不确定更改列数据类型会对内存造成多大影响。

赞(0）回复(0）举报 2023-03-16

qij5mzcb2#

map（或 Dataframe 的applymap）似乎更快。
技巧是使用lambda x: mapping.get(x, x)作为Map，实际上返回默认情况下不变的值。

df = pd.DataFrame(np.random.randint(1, 5, size=(100, 1000)))

mapping = {1: "one", 2: "two", 4: "four"}

res1 = df.replace(mapping)
res2 = df.applymap(lambda x: mapping.get(x, x))

pd.testing.assert_frame_equal(res1, res2)

>>> %timeit df.replace(mapping)
>>> %timeit df.applymap(lambda x: mapping.get(x, x))
175 ms ± 855 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)
86.1 ms ± 725 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)

赞(0）回复(0）举报 2023-03-16

我来回答

pandas 有没有办法在适当的位置创建一个Series.map，但在不匹配时保留原始值？

2条答案

相关问题

热门标签

最新问答