我有一个演员名字的数据框:
DF1型
actor_id actor_name
1 Brad Pitt
2 Nicole Kidman
3 Matthew Goode
4 Uma Thurman
5 Ethan Hawke
另一个演员所演电影的 Dataframe :
二氟乙烷
actor_id actor_movie movie_revenue_m
1 Once Upon a Time in Hollywood 150
2 The Others 50
2 Moulin Rouge 200
3 Stoker 75
4 Kill Bill 125
5 Gattaca 85
我想把两个 Dataframe 合并在一起,以显示演员的电影名称和电影收入,所以我使用了merge函数:
df3 = df1.merge(df2, on = 'actor_id', how = 'left')
三氟甲苯
actor_id actor_name actor_movie movie_revenue
1 Brad Pitt Once Upon a Time in Hollywood 150
2 Nicole Kidman Moulin Rouge 50
2 Nicole Kidman The Others 200
3 Matthew Goode Stoker 75
4 Uma Thurman Kill Bill 125
5 Ethan Hawke Gattaca 85
但是这会拉入所有的电影,所以妮可·基德曼会被复制,而我只想为每个演员放映一部电影。
如何合并按字母顺序排在第一位的电影标题?
我如何合并收入最高的电影名称?
谢谢你,谢谢你
1条答案
按热度按时间tvmytwxo1#
一种方法是继续合并,然后过滤结果集
按字母顺序排在第一位的电影标题
第一个
收入最高的电影标题
第一个