我有一个下面的数据框,我试图用最有效的方法得到空字符串的列名。执行df.head()后,数据框看起来如下。
id type check company test
123 A Soft [[1649106820, 100029907158392,,,, 123]]
456 B Hard GMC [[1649106812, 100029907158312,,,, 456]]
我正尝试不使用循环或以有效的方式来做它。感谢帮助
预期输出{公司,测试}
2条答案
按热度按时间mwg9r5ms1#
使用
apply()
对所有行执行测试,然后使用.any()
测试是否对任何行都为true。fgw7neuy2#
下面是一种查找包含空字符串的列而不测试单个值类型的方法:
输出:
说明:
explode()
两次,以确保我们已经解包了类型为list of list的值,例如问题中test
列中的值astype(str)
将数字类型转换为字符串,如列id
中的类型str.strip().eq('')
获取给定列的boolean Series,指示值(可能未打包)是否为空字符串(在去除空格后)Series.any()
将boolean Series简化为指示列是否有空字符串的布尔值