如何修改pandas中的groupby操作的输出格式,该操作为非常大的数字生成科学记数法?
我知道如何在python中进行字符串格式化,但在这里应用它时,我不知所措。
df1.groupby('dept')['data1'].sum()
dept
value1 1.192433e+08
value2 1.293066e+08
value3 1.077142e+08
如果我转换成字符串,这会抑制科学记数法,但现在我只是想知道如何设置字符串格式并添加小数。
sum_sales_dept.astype(str)
9条答案
按热度按时间nwo49xxi1#
当然,我在评论中链接的答案不是很有帮助。您可以像这样指定自己的字符串转换器。
我不确定这是不是最好的方法,但它确实有效。
纯粹出于美学目的将数字转换为字符串似乎是一个坏主意,但如果你有一个很好的理由,这是一种方法:
nimxete22#
下面是另一种方法,类似于Dan Allan's answer,但没有lambda函数:
或
flseospp3#
您可以使用round函数来抑制特定 Dataframe 的科学计数法:
也可以通过以下方式全局抑制:
z8dt9xmd4#
如果要在jupyter notebook单元格中设置数据框输出的样式,可以在每个数据框的基础上设置显示样式:
请参阅此处的文档。
zbsbpyhn5#
在全局范围内设置固定的小数位数通常不是一个好主意,因为无论大小如何,它都不太可能是您将显示的所有各种数据的适当小数位数。相反,尝试这样做,它将为您提供仅用于大值和非常小的值的科学记数法(并添加千位分隔符,除非您省略“,”):
或者,为了几乎完全抑制科学记数法而不损失精度,请尝试以下操作:
4zcjmb1e6#
我有多个不同浮点数的 Dataframe ,所以感谢Allans的想法,使动态长度。
这个的缺点是,如果你在float中有最后一个0,它会削减它。所以它不是0.000070,而是0.00007。
vhmi4jdf7#
扩展这个有用的注解,这里是一个解决方案,它设置格式选项仅显示结果,而不永久更改选项:
tf7tbtn28#
如果你想使用这些值,比如说作为csvfile csv.writer的一部分,可以在创建列表之前格式化这些数字:
vmpqdwk39#
这个问题我已经提了至少十几次了,因为我总是忘记怎么做。我发现了一个更简单的解决方案,这里没有提到使用
pandas.DataFrame.round
:或