我想使用tidymodels来构建一个NLP问题的工作流,我有一个使用naivebayes
包以传统方式构建的基本流程,它基本上将文档-术语矩阵(每个文档中出现的术语的计数)提供给multinomial_naive_bayes
函数。
虽然有parsnip
interface for the naivebayes package,但它似乎只能与通用naive_bayes
函数一起工作。根据naivebayes documentation,它似乎是唯一不能通过通用函数访问的格式:
请注意,多项式朴素贝叶斯不能通过naive_bayes函数使用。
所以我的三个问题是
1.是否有方法使用parsnip
访问multinomial_naive_bayes
函数?
1.是否有办法将通用naive_bayes
函数用于此格式的数据(要素计数)?
1.最好的替代方案是什么?我看到parsnip
也支持h2o
和klaR
,但我不熟悉这些包。
我希望问题1和2的答案是“否”,但值得一查。欢迎对问题3提出建议。
1条答案
按热度按时间ryevplcw1#
我希望问题1和2的答案是“否”,但值得检查。
正确。我们没有那个/那些的引擎。你可以加一个issue to add them though。
欢迎就第三季度提出咨询意见。
看看textrecipes软件包,它可以让你在文本处理方面达到你的目的,并且可以无缝地与tidymodels目前支持的引擎协同工作,这个软件包非常优秀,它有很多功能,否则使用起来会很痛苦。