python—删除包含特殊字符的行，如pyspark或pysql中的“/”

yqkkidmi 于 2021-05-29 发布在 Spark

关注(0)|答案(1)|浏览(735)

我有一个包含a列的数据

输出应为like:-

105
103

我在pyspark和pysql中尝试了很多filter函数，但代码不起作用

python apache-spark pyspark apache-spark-sql pyspark-dataframes

来源：https://stackoverflow.com/questions/62535334/remove-rows-which-contain-special-character-like-in-pyspark-or-pysql

1条答案

按热度按时间

xytpbqjk1#

你可以用任何一个 rlike,like,contains 具有的函数 negation (~) ```
df=spark.createDataFrame([('107/108',),('105',),('103',),('103/104',)],['A'])
df.show()

+-------+

| A|

+-------+

|107/108|

| 105|

| 103|

|103/104|

+-------+

from pyspark.sql.functions import *

using rlike function

df.filter(~col("A").rlike("/")).show()

using like function

df.filter(~col("A").like("%/%")).show()

using contains function

df.filter(~col("A").contains("/")).show()

+---+

| A|

+---+

|105|

|103|

+---+

`UPDATE:`
df=spark.createDataFrame([('107/108',),('105',),('103',),('103/104',),('',)],['A'])
df.show()

+-------+

| A|

+-------+

|107/108|

| 105|

| 103|

|103/104|

| |

+-------+

df.filter(~col("A").rlike("/")).show()
df.filter(~col("A").like("%/%")).show()
df.filter(~col("A").contains("/")).show()

+---+

| A|

+---+

|105|

|103|

| |

+---+

赞(0）回复(0）举报 2021-05-29

我来回答

python—删除包含特殊字符的行，如pyspark或pysql中的“/”

1条答案

+-------+

| A|

+-------+

|107/108|

| 105|

| 103|

|103/104|

+-------+

using rlike function

using like function

using contains function

+---+

| A|

+---+

|105|

|103|

+---+

+-------+

| A|

+-------+

|107/108|

| 105|

| 103|

|103/104|

| |

+-------+

+---+

| A|

+---+

|105|

|103|

| |

+---+

相关问题

热门标签

最新问答