static Dataset<Row> createTestStreamingDataFrame() {
MemoryStream<String> testStream= new MemoryStream<String>(100, sqlContext(), Encoders.STRING());
testStream.addData((Arrays.asList("1,1","2,2","3,3")).toSeq());
return testStream.toDF().selectExpr(
"cast(split(value,'[,]')[0] as int) as testCol1",
"cast(split(value,'[,]')[1] as int) as testCol2");
}
1条答案
按热度按时间ecfsfe2w1#
显然,您可以参考这个答案,了解如何使用内存流进行单元测试-单元测试-结构化流
另外,你可以看看霍顿卡劳的Spark测试基地。Spark试验基地
您可以模拟来自kafka的流Dataframe,并在该Dataframe之上的代码中为转换运行测试用例。
样品: