建议为jieba.posseg增加cut_all选项,允许采用全模式分词状态下再进行词性标注以得到更全的结果
k5hmc34c1#
我也需要啊,现在还没有这个api?
mspsb9vt2#
同需要,求大佬开发
jgwigjjp3#
提出一种暂时的替代方案,先用全模式分词,再输入到词性标注分词器里(用空格隔开),最后去掉空格
seg_list = jieba.cut("我来到北京清华大学", cut_all=True, HMM=True)full_mode_sentence = " ".join(seg_list)
words = pseg.cut(full_mode_sentence, HMM=True)for word, flag in words:if word != ' ':print('%s %s' % (word, flag))
dauxcl2d4#
逻辑鬼才
4条答案
按热度按时间k5hmc34c1#
我也需要啊,现在还没有这个api?
mspsb9vt2#
同需要,求大佬开发
jgwigjjp3#
提出一种暂时的替代方案,先用全模式分词,再输入到词性标注分词器里(用空格隔开),最后去掉空格
seg_list = jieba.cut("我来到北京清华大学", cut_all=True, HMM=True)
full_mode_sentence = " ".join(seg_list)
words = pseg.cut(full_mode_sentence, HMM=True)
for word, flag in words:
if word != ' ':
print('%s %s' % (word, flag))
dauxcl2d4#
提出一种暂时的替代方案,先用全模式分词,再输入到词性标注分词器里(用空格隔开),最后去掉空格
seg_list = jieba.cut("我来到北京清华大学", cut_all=True, HMM=True)
full_mode_sentence = " ".join(seg_list)
words = pseg.cut(full_mode_sentence, HMM=True)
for word, flag in words:
if word != ' ':
print('%s %s' % (word, flag))
逻辑鬼才