我想在column_1的基础上创建一个新列,它在索引i的每一行上将column_1的所有内容相加到索引i。
我已经找到了一种方法来实现这一点:抓取行并将其求和为每行的索引:
column_array = np.array(df['column_1'])
df['new column'] = [column_array[:n].sum() for n in range(len(column_array)]'
字符串
但是这样做需要从一开始就对每个条目求和,我正在处理大量的大 Dataframe ,所以我想要一个有效的解决方案,因为现在这个求和操作是我脚本的瓶颈。
3条答案
按热度按时间vx6bjr1n1#
正如BigBen所说,
cumsum()
正是这样做的。看看您自己的示例,您有一个移动的列。如果这确实是你想要的,你也可以使用shift()
。请尝试运行以下代码:字符串
332nm8kg2#
您可以使用
pandas
的cumsum()
函数来获取数据元素的累积和。请尝试以下操作:字符串
9cbw7uwe3#
我个人不会在这项任务上使用理解力。遍历列并跟踪sum,然后在每次迭代中简单地追加到新列。
字符串