我有Spark dataframe
它有三列,即
身份证件
实体名称
地址。
我想创造一个边缘 dataframe
基本上有两列实体id共享一个公共地址。例如,如果id1和 ID2
共享一个公共地址,那么它就是边缘的一部分 dataframe
. 我是新来的Spark,因此不知道如何进行。实现这一点的示例代码将非常有用。
最终,我将使用这一优势 dataframe
使用创建图形 GraphFrames
.
我有Spark dataframe
它有三列,即
身份证件
实体名称
地址。
我想创造一个边缘 dataframe
基本上有两列实体id共享一个公共地址。例如,如果id1和 ID2
共享一个公共地址,那么它就是边缘的一部分 dataframe
. 我是新来的Spark,因此不知道如何进行。实现这一点的示例代码将非常有用。
最终,我将使用这一优势 dataframe
使用创建图形 GraphFrames
.
暂无答案!
目前还没有任何答案,快来回答吧!