我使用4个数据集,它们非常相同(下面给出的示例数据头)。我使用plotly graph_objects Box函数和make_subplots函数来创建箱线图。下面是代码和生成的图,这似乎是错误的。
Rank Company Revenue employees Industry age
0 1 Walmart 523964 2,300,000 Tech 44
1 2 Sinopec Group 407009 71,200 Tech 56
# Set up the subplots grid
fig = make_subplots(rows=2, cols=2,
# Set the subplot titles
subplot_titles=['Tech', 'Professional Services', 'Retail', 'Oil'])
# Add the Tech trace
fig.add_trace(go.Box(x=df_tech.Revenue, name='', showlegend=False), row=1, col=1)
# Add the Professional Services trace
fig.add_trace(go.Box(x=df_prof_serve.Revenue, name='', showlegend=False), row=1, col=2)
# Add the Retail trace
fig.add_trace(go.Box(x=df_retail.Revenue, name='', showlegend=False), row=2, col=1)
# Add the Oil trace
fig.add_trace(go.Box(x=df_oil.Revenue, name='', showlegend=False), row=2, col=2)
# Add a title (and show)
fig.update_layout({'title': {'text': 'Box plots of company revenues', 'x': .5, 'y': .9}})
fig.show()
字符串
的数据
理想情况下,图应该如下所示。我尝试使用一个数据集和go.Figure直接绘制一个图,而不是子图。但结果是相同的,不正确的图。看起来异常值被吸入了我所有图中的胡须部分。下面的预期图清楚地显示了异常值,并且正确地显示了分布。请建议这里应该做什么。
的
1条答案
按热度按时间up9lanfz1#
哦.我得到了解决.这是我的一部分愚蠢的错误.它发生在我检查数据类型.我发现,正如我所正确预期的'收入'功能是'
Object
'类型.我将其转换为'integer
',一切都工作得很好.谢谢大家,希望这有助于.