我在我的特定数据框架案例中找不到答案。想在Python中的大型数据集上使用笛卡尔积(交叉连接)。我发现了许多相关的帖子,如:使用pandas的性能笛卡尔积(CROSS JOIN),但我不能轻松地应用这些,因为我有索引,我不能轻松地将数据集切片到单个列,然后合并。
我的数据:其中年(2021-2022)和天(1D,2D,3D)是索引。
我的目标:是创建“新”索引的笛卡尔积,我现在不能轻易地抓住。新索引是:年,日,名。
解决方案如下:data3 = d1.merge(d2, how="cross")
不工作,因为year索引被删除,并且创建了太多列,而没有将days分配为一列。
1条答案
按热度按时间z9smfwbn1#
根据您的图像,您可以:
最小可重现性示例: