jieba.analyse.textrank() 方法提取英文文本的关键词没有输出数据,但是 jieba.analyse.tfidf() 方法则可以处理英文文本。中文文本两个都可以处理。so ,问题是,,,
jieba.analyse.textrank()
jieba.analyse.tfidf()
qgzx9mmu1#
你看看源代码就知道了,tokenizer和postokenizer的区别。
xkftehaa2#
那要如何解决这个问题呢? 使的 textrank 能够用于英文文本
zbwhf8kr3#
我也有这个问题,我后来使用了 TextRank4ZH 这个包,可以使用 textrank 算法提取出英文关键词。https://github.com/letiantian/TextRank4ZH
3条答案
按热度按时间qgzx9mmu1#
你看看源代码就知道了,tokenizer和postokenizer的区别。
xkftehaa2#
你看看源代码就知道了,tokenizer和postokenizer的区别。
那要如何解决这个问题呢? 使的 textrank 能够用于英文文本
zbwhf8kr3#
我也有这个问题,我后来使用了 TextRank4ZH 这个包,可以使用 textrank 算法提取出英文关键词。
https://github.com/letiantian/TextRank4ZH