ConllCorpusReader _require()函数在许多功能中都需要一个PoS字段,但在实践中似乎没有必要。实际上,许多语料库都是分块分布的,例如没有PoS字段的命名实体(NE),这就将确定这个中间信息的任务交给了最终用户。
因此,这个_require()需求是否可以放宽?例如从nltk/corpus/reader/conll.py中可以看到:
def tagged_sents(self, fileids=None, tagset=None):
self._require(self.WORDS, self.POS)
1条答案
按热度按时间jogvjijk1#
@leondz – 您的示例
tagged_sents()
需要词性信息。是否有特定的方法可以去除词性要求?