在pyspark中基于条件连接表

vm0i2vca 于 2024-01-06 发布在 Spark

关注(0)|答案(1)|浏览(149)

我想连接pyspark表，其中第一个表有id，startTime和endTime，其中第二个表有Time和value。合并后的表将有每个id的列Time和value，其中startTime<=Time<=endTime。id中的startTime和endTime s可能重叠

pyspark

来源：https://stackoverflow.com/questions/77607089/joining-tables-in-pyspark-based-on-condition

1条答案

按热度按时间

06odsfpq1#

假设df1和df2是你的两个数组：

from pyspark.sql import functions as F
result = df1.join(
    df2,
    on=F.col("Time").between(F.col("startTime"), F.col("endTime")),
    how="inner",
)

字符串

赞(0）回复(0）举报 2024-01-06

我来回答

在pyspark中基于条件连接表

1条答案

相关问题

热门标签

最新问答