nltk 放松ConllCorpusReader的PoS要求

ergxz8rk  于 6个月前  发布在  其他
关注(0)|答案(1)|浏览(48)

ConllCorpusReader _require()函数在许多功能中都需要一个PoS字段,但在实践中似乎没有必要。实际上,许多语料库都是分块分布的,例如没有PoS字段的命名实体(NE),这就将确定这个中间信息的任务交给了最终用户。

因此,这个_require()需求是否可以放宽?例如从nltk/corpus/reader/conll.py中可以看到:

def tagged_sents(self, fileids=None, tagset=None):
    self._require(self.WORDS, self.POS)
jogvjijk

jogvjijk1#

@leondz – 您的示例 tagged_sents() 需要词性信息。是否有特定的方法可以去除词性要求?

相关问题