R语言 如何删除tm_map中的“英语”单词?

6qfn3psc  于 2023-01-28  发布在  其他
关注(0)|答案(1)|浏览(109)

tm_map在文本挖掘方面非常有用。现在我将使用tm_map删除文本中的“英语”单词。有人能教我如何编写语法(如removeNumbers)吗?

6pp0gazn

6pp0gazn1#

一个选项可以是用户定义一个单词列表,或者更激进地,将整个英语词典作为单词列表加载。在删除单词的第一个代码中,代码将是:

corp <- tm_map(corp, removeWords, c("will", "oxford",
                                    "chart", "spain",
                                    "economy", "expect", 
                                    "still", "rose", "fall"))

相关问题