假设我有这个Dataframe。。
TEST_schema = StructType([StructField("col1", IntegerType(), True),\
StructField("col2", IntegerType(), True)])
TEST_data = [(5,-1),(4,-1),(3,3),(2,2),(1,-1),(0,-1),(0,-1),(0,2),(0,-1)]
rdd3 = sc.parallelize(TEST_data)
TEST_df = sqlContext.createDataFrame(TEST_data, TEST_schema)
TEST_df.show()
+----+----+
|col1|col2|
+----+----+
| 5| -1|
| 4| -1|
| 3| 3|
| 2| 2|
| 1| -1|
| 0| -1|
| 0| -1|
| 0| 2|
| 0| -1|
+----+----+
我要做的是在col1==1之后计算'-1'的数目。
那之后呢 col1 == 1 df.count()
返回4。
1条答案
按热度按时间s1ag04yj1#
这个代码可能对你有帮助,