我有一张Cassandratable,结构如下:
CREATE TABLE myKeyspace.myTable (
rowkey text,
columnname text,
columnvalue text,
PRIMARY KEY (rowkey, columnname)
)
我想插入数据在同一SparkCassandra连接器。
我的spark数据集属于 Dataset[Seq[(String, String, String)]]
.
我想把它转换成 Dataset[(String, String, String)]
以便可以使用 .rdd.saveToCassandra
应用程序编程接口。
请协助转换或有没有直接的方法使用相同的 Dataset[Seq[(String, String, String)]]
.
1条答案
按热度按时间bq9c1y661#
呼叫
flatMap
在Dataset[Seq[(String, String, String)]]
,请检查下面,如果不工作请告诉我。