pyspark分区Dataframe用于rnn训练

n3ipq98p 于 2021-05-26 发布在 Spark

关注(0)|答案(0)|浏览(322)

我有一个航班数据集，其中一列是 aircraft 一个是给 Flight_ID . 每个航班包含1500行和75列的数组，对应于特定时间段内来自飞机的传感器值。
我正在训练一个lstm自动编码器，把每一次飞行都输入到模型中，这在spark的32个执行器集群上运行。
有没有一种方法可以在训练之前对Dataframe进行分区/存储，以便执行者使用包含一个Dataframe的分区来训练模型 aircraft 按时间顺序排列？
谢谢！

python apache-spark partitioning lstm

来源：https://stackoverflow.com/questions/65223392/pyspark-partition-dataframe-for-rnn-trainning

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

pyspark分区Dataframe用于rnn训练

暂无答案！

相关问题

热门标签

最新问答