pandas 抓取包含联盟最大值的行[重复]

6ju8rftf 于 2024-01-04 发布在其他

关注(0)|答案(2)|浏览(142)

此问题在此处已有答案：

Custom sorting in pandas dataframe（5个答案）
2天前关闭。
我想抓住一个球员每年参加的最高联赛的行。我已经把我想比较的每个联赛从最低到最高排列了一个列表，我从下面的代码中创建了一个列表。

import pandas as pd
prospect = pd.read_html('https://www.baseball-reference.com/register/player.fcgi?id=bishop000hun')[0]
levels = ['Rk', 'A-', 'A', 'A+', 'AA', 'AAA', 'MLB']
prospect = prospect[['Year', 'Tm', 'Lg', 'Lev', 'PA']][prospect['Lev'].isin(levels)]
prospect = prospect.sort_values('Lev', ascending = False).groupby(['Year']).tail(1)

字符串
但是，我生成了这个输出。

Year    Tm  Lg  Lev PA
6   2019    Salem-Keizer    NORW    A-  117
15  2022    Eugene  NORW    A+  358
11  2021    San Jose    LAW A   9

型
我所希望的是2021行给我的行包含A+级而不是A级.有人能帮助我如何解决这个错误？提前感谢.

pandas

来源：https://stackoverflow.com/questions/77744103/grab-rows-that-contain-max-value-of-league

2条答案

按热度按时间

uqzxnwby1#

你可以像这样实现它

import pandas as pd
# Example data
data = {
    'Year': [2019, 2019, 2022, 2022, 2021, 2021],
    'Tm': ['A', 'B', 'C', 'D', 'E', 'F'],
    'Lg': ['NORW', 'ABC', 'NORW', 'ABC', 'LAW', 'ABC'],
    'Lev': ['A-', 'Rk', 'A+', 'A-', 'A', 'A+'],
    'PA': [117, 100, 358, 200, 9, 50]
}
prospect = pd.DataFrame(data)
levels = ['Rk', 'A-', 'A', 'A+', 'AA', 'AAA', 'MLB']
# Convert 'Lev' to categorical type with the specified order
prospect['Lev'] = pd.Categorical(prospect['Lev'], categories=levels, ordered=True)
# Filter and get the first row for each year after sorting in descending order by 'PA'
prospect = prospect.sort_values(['Year', 'PA'], ascending=[True, False]).groupby('Year').first().reset_index()
print(prospect)

字符串
输出量：

Year Tm    Lg Lev   PA
0  2019  A  NORW  A-  117
1  2021  F   ABC  A+   50
2  2022  C  NORW  A+  358

型

展开查看全部

赞(0）回复(0）举报 2024-01-04

guykilcj2#

你的例子

import pandas as pd
prospect = pd.read_html('https://www.baseball-reference.com/register/player.fcgi?id=bishop000hun')[0]
levels = ['Rk', 'A-', 'A', 'A+', 'AA', 'AAA', 'MLB']
prospect = prospect[['Year', 'Tm', 'Lg', 'Lev', 'PA']][prospect['Lev'].isin(levels)]

字符串
使用键的sort_values

m = {j: i for i, j in enumerate(levels)} 
out = prospect.sort_values('Lev', key=lambda x: x.map(m)).groupby(['Year']).tail(1)

型
输出：

Year    Tm              Lg      Lev PA
6   2019    Salem-Keizer    NORW    A-  117
10  2021    Eugene          HAW     A+  15
15  2022    Eugene          NORW    A+  358

型

展开查看全部

赞(0）回复(0）举报 2024-01-04

我来回答

pandas 抓取包含联盟最大值的行[重复]

2条答案

相关问题

热门标签

最新问答