如何将具有给定值的列添加到Pandas数据框中，并按另一列分组？

vq8itlhq 于 2023-04-19 发布在其他

关注(0)|答案(2)|浏览(134)

我有两个Pandas Dataframe ：

print(df_a)
   ID  irrelevant_value
0   1  1.2
1   1  2.3
2   1  0.9
3   1  1.1
4   2  2.7
5   2  3.1
6   3  1.3
7   3  0.2
8   3  2.3
...

和

ID  add_these_values_to_the_same_ID
0   1   100
1   2   120
2   3   90
...

我想把它们结合起来，这样-期望的结果：

print(df_a)

    ID  irrelevant_value  add_these_values_to_the_same_ID
0   1   1.2               100
1   1   2.3               100
2   1   0.9               100
3   1   1.1               100
4   2   2.7               120
5   2   3.1               120
6   3   1.3               90
7   3   0.2               90
8   3   2.3               90
...

如何才能做到这一点？
我一直在与df_a.groupby（[“ID”]）作斗争，但找不到前进的方向。

pandas

来源：https://stackoverflow.com/questions/76007530/how-to-add-a-column-with-given-values-to-a-pandas-dataframe-grouped-by-another

2条答案

按热度按时间

c0vxltue1#

这里不需要groupby函数;相反，只需使用merge。正如这些文档中所述，
如果两个键列都包含键为空值的行，则这些行将相互匹配。这与通常的SQL连接行为不同，可能会导致意外结果。
而且你的两个 Dataframe 都包含ID。因此，你可以用下面的代码合并 Dataframe （这只是一种方法，但它确实有效）：

import pandas as pd

# Example dataframes - these might be defined elsewhere in your situation
data_a = {'ID': [1, 1, 1, 1, 2, 2, 3, 3, 3],
          'irrelevant_value': [1.2, 2.3, 0.9, 1.1, 2.7, 3.1, 1.3, 0.2, 2.3]}
df_a = pd.DataFrame(data_a)

data_b = {'ID': [1, 2, 3],
          'add_these_values_to_the_same_ID': [100, 120, 90]}
df_b = pd.DataFrame(data_b)

# Merge dataframes on the 'ID' column
result = df_a.merge(df_b, on='ID')

print(result)

真正重要的一行是：

result = df_a.merge(df_b, on='ID')

这将输出：

ID  irrelevant_value  add_these_values_to_the_same_ID
0   1               1.2                             100
1   1               2.3                             100
2   1               0.9                             100
3   1               1.1                             100
4   2               2.7                             120
5   2               3.1                             120
6   3               1.3                              90
7   3               0.2                              90
8   3               2.3                              90

这应该可以工作，但如果您的数据不适用于此方法，您可以查看how：
how{‘left’, ‘right’, ‘outer’, ‘inner’, ‘cross’}，默认inner要执行的合并类型。

left：只使用左帧的键，类似于SQL左外连接;保持密钥顺序。
right：只使用右帧中的键，类似于SQL右外连接;保持密钥顺序。
outer：使用来自两个帧的键的联合，类似于SQL全外连接;按字典顺序对键排序。
inner：使用两个帧的键的交集，类似于SQL内部连接;保持左键的顺序。
cross：从两个帧创建笛卡尔积，保留左键的顺序。

outer可以工作，如果上面的代码不工作。

赞(0）回复(0）举报 2023-04-19

g0czyy6m2#

尝试：dataframe.merge

df_a.merge(other_df, left_on = 'ID', right_on = 'ID')

赞(0）回复(0）举报 2023-04-19

我来回答

如何将具有给定值的列添加到Pandas数据框中，并按另一列分组？

2条答案

相关问题

热门标签

最新问答