我有一个DataFrame,里面有公寓的价格和房间的数量(客厅,霍尔斯,浴室)。我需要做一个条形图,表示价格如何取决于每种房型的数量。
显示我的数据,但显示不正确。我到底做错了什么?
dataFrame = pd.read_csv('dataset.csv', sep=',') #read the dataset
dataFrame.replace('', np.nan)
#create new smaller dataset
roomsDF = pd.DataFrame(dataFrame[['Price', 'Living Rooms', 'Halls', 'Bathrooms']])
roomsDF = roomsDF.dropna(axis='rows')
#plotting
plt.figure(figsize=(12, 4))
plt.subplot(131)
print(roomsDF.head(300))
plt.bar(roomsDF['Living Rooms'], roomsDF['Price'], color='darkgreen')
plt.subplot(132)
plt.bar(roomsDF['Halls'], roomsDF['Price'], color='limegreen')
plt.subplot(133)
plt.bar(roomsDF['Bathrooms'], roomsDF['Price'], color='seagreen')
plt.savefig('Picture')
字符串
它肯定应该出现在一个上升的方式(逻辑上)(我已经检查!)有1个客厅的公寓比有2个客厅的便宜),但它有一个巨大的价格为1室公寓。
数据是这样的东西:一个客厅的平均价格应为~659,两个L房间的平均价格应为~1061(在Excel中计算)Data
Graph是这样的:Graph的
2条答案
按热度按时间ftf50wuq1#
这可能是因为数据类型,你可以尝试这个更新的代码,我为你开发的,但如果我知道什么是数据或共享的一部分,我可以帮助你更好
字符串
tsm1rwdh2#
在这里我也需要使用
groupby
。没有groupby
,它只是显示一些随机的东西。字符串