我有以下清单:
mylist = ['pages', 'disable', 'sensitive', 'application', 'screen', 'login', 'dynamic', 'frida', 'use', 'capture', 'stronger', 'flag_secure', 'strengthen', 'default', 'registration', 'obfuscate', 'anti', 'feature', 'protection', 'blurring', 'appsview', 'instrumentation', 'recent', 'paste', 'copy', 'exported', 'improve', 'mechanism', 'device', 'encryption', 'information', 'version', 'code', 'components', 'restrict', 'access', 'data', 'adding', 'debugger', 'otp', 'runtime', 'server', 'instrument', 'ensure', 'input', 'link', 'special', 'magisk', 'magic', 'obfuscation']
我有一个数据框,其中包含一组字符串:
0 Implement stronger root detection and adding debugger or dynamic instrument detection at runtime.
1 Strengthen root detection and implement Frida detection.
2 Implement code obfuscation to the application.
3 Disable screen capture by default and use FLAG_SECURE.
4 Implement screen blurring on the Recent Apps view.
如何计算数据框上mylist中每个元素的出现次数,并按其值计数对其进行排序?
这就是我希望得到的结果:
Word Count
pages 31
disable 25
sensitive 6
我怎样才能做到这一点?
2条答案
按热度按时间qxgroojn1#
您的预期输出与给定的示例数据不匹配。
首先可以在空间上拆分列,然后
strip
去掉任何剩余的空格或句号和逗号,然后分解它,然后调用value_counts
及reindex
在列表中,最后删除NaN
值,并按降序对值进行排序。它假定
case-sensitive
计数。输出:
gdrx4gfi2#
我希望我已经很好地理解了你的问题。这个例子适用于所有的单词
mylist
并统计 Dataframe 中的出现次数df
(df["col1"]
您的列是否包含字符串):印刷品: