我试图使用一个sankey图表来显示一些使用PySankey的用户细分变化,但类顺序与我想要的相反。有没有一种方法可以让我指定每个类的发布顺序?下面是我使用的代码(虚拟版本):
test_df = pd.DataFrame({
'curr_seg':np.repeat(['A','B','C','D'],4),
'new_seg':['A','B','C','D']*4,
'num_users':np.random.randint(low=10, high=20, size=16)
})
sankey(
left=test_df["curr_seg"], right=test_df["new_seg"],
leftWeight= test_df["num_users"], rightWeight=test_df["num_users"],
aspect=20, fontsize=20
)
它产生了这个图表:
我想在左右轴上都先有A级,最后有D级。有谁知道我该怎么安装吗?非常感谢。
2条答案
按热度按时间nlejzf6q1#
check_data_matches_labels
函数的第一行有一个bug,需要修改为以下内容:if len(labels) > 0:
然后你可以使用leftLabels
和rightLabels
来控制顺序。djmepvbi2#
IIIIR所说的bug在pySankeyBeta中已修复,请使用
pip install pySankeyBeta
安装。