python 如何获取polars列表中元素的当前索引

ruarlubt 于 2024-01-05 发布在 Python

关注(0)|答案(3)|浏览(262)

当计算列表元素时，我想知道并使用当前索引。是否已经有一种方法可以做到？
比如pl.element().idx()？

import polars as pl
data = {"a": [[1,2,3],[4,5,6]]}
schema = {"a": pl.List(pl.Int8)}
df = pl.DataFrame(data, schema=schema).with_columns([
    pl.col("a").list.eval(pl.element() * pl.element().idx() )
])

字符串
预期结果：

+-------------+
¦ a           ¦
¦ ---         ¦
¦ list[u8]    ¦
¦-------------¦
¦ [0, 2, 6]   ¦
¦ [0, 5, 12]  ¦
+-------------+

型

python

来源：https://stackoverflow.com/questions/76523245/how-to-get-current-index-of-element-in-polars-list

3条答案

按热度按时间

waxmsbnn1#

您可以使用apply方法沿着使用enumerate函数来实现访问列表列中每个元素的当前索引的预期结果。下面是一个如何实现的示例：

import polars as pl
data = {"a": [[1,2,3],[4,5,6]]}
schema = {"a": pl.List(pl.Int8)}
df = pl.DataFrame(data, schema=schema).with_columns([
    pl.col("a").apply(lambda arr: [x * i for i, x in enumerate(arr)])
])
print(df)

字符串
输出

shape: (2, 1)
┌────────────┐
│ a          │
│ ---        │
│ list[i64]  │
╞════════════╡
│ [0, 2, 6]  │
│ [0, 5, 12] │
└────────────┘

型

展开查看全部

赞(0）回复(0）举报 2024-01-05

ef1yzkbh2#

使用pl.element().cum_count()可以很容易地访问列表中元素的索引，如下所示：

df.with_columns(
    pl.col("a").list.eval(pl.element() * pl.element().cum_count())
)

字符串

输出。

shape: (2, 1)
┌────────────┐
│ a          │
│ ---        │
│ list[i64]  │
╞════════════╡
│ [0, 2, 6]  │
│ [0, 5, 12] │
└────────────┘

型

展开查看全部

赞(0）回复(0）举报 2024-01-05

iibxawm43#

最好的方法（据我所知）是创建一个行索引，爆炸，使用cumcount和一个窗口函数来创建idx（我称之为j），然后用groupby/agg把它放回一起

(
    df
        .with_row_count('i')
        .explode('a')
        .with_columns(j=pl.first().cumcount().over('i'))
        .with_columns(new=pl.col('a')*pl.col('j'))
        .groupby('i', maintain_order=True)
        .agg(pl.col('new'))
        .drop('i')
)

字符串

赞(0）回复(0）举报 2024-01-05

我来回答

python 如何获取polars列表中元素的当前索引

3条答案

相关问题

热门标签

最新问答