如何从嵌套字典创建sparkDataframe?我是新来的。我不想使用PandasDataframe。
我的字典看like:-
{'prathameshsalap@gmail.com': {'Date': datetime.date(2019, 10, 21),'idle_time': datetime.datetime(2019, 10, 21, 1, 50)},
'vaishusawant143@gmail.com': {'Date': datetime.date(2019, 10, 21),'idle_time': datetime.datetime(2019, 10, 21, 1, 35)},
'you@example.com': {'Date': datetime.date(2019, 10, 21),'idle_time': datetime.datetime(2019, 10, 21, 1, 55)}
}
我想用pysparkDataframe把这个dict转换成sparkDataframe。
我的期望output:-
Date idle_time
user_name
prathameshsalap@gmail.com 2019-10-21 2019-10-21 01:50:00
vaishusawant143@gmail.com 2019-10-21 2019-10-21 01:35:00
you@example.com 2019-10-21 2019-10-21 01:55:00
2条答案
按热度按时间2eafrhcq1#
您需要重做字典并构建行以正确推断模式。
注意:如果您已经准备好了模式,并且不需要推断,那么只需将模式提供给createdataframe函数:
vd8tlhqk2#
将字典转换为元组列表,然后每个元组将成为spark dataframe中的一行:
为数据定义架构:
创建sparkDataframe: