我在spark dataframe中有以下数据集。我需要根据给定的条件进行过滤:
等于: ID: (6, 7, 8, 9, 13, 15, 16, 18)
不等于: STATE :(Illinois, Oklahoma)
, CITY: (Orange, Boca_Raton)
我需要迭代这些列以获得作为键值对的过滤器值,而不是硬编码这些值并过滤Dataframe以获得结果df。
IDnameCitystate1roseannrichmonddvirginia3jamesonfort\uLauderdaleFlorida4marlinewashingtondistrict\uColumbia5IvoryMacongeorgia6tobysan\uDiegoCalifornia7isaccoroleeonlianecalivornia9lannieepeoriaoklahoma10BradleytulsaOklahoma11Teodorapittsburghpennsylvania12benediktatampaflorida13zelmanewport\uNewsCalifornia14Carilynflintmichigan15joey加利福尼亚州博卡市16帕蒂博斯顿市17达科他州比斯马尔克诺思市18格伦德卡图罗克拉霍马市19希尔顿菲尼克萨里佐纳市20巴比特新奥尔良市
1条答案
按热度按时间6yoyoihd1#
你可以用
isin
具有值列表的函数。像这样: