比如微博的表情文字是 [泪]我想拿到这个表情统计个数,请问可以怎么做?
zbdgwd5y1#
是不是可以把[] 去掉 后再处理。
nhjlsmyf2#
我已经搞定了,先用正则表达式把"[ []]" 把表情识别出来再添加到自己的词库里面。
iyfjxgzm3#
@Justxu 不行啊,我试着jieba.add_word('[白眼]'),但是结果里还是会把文字和符号拆开
3条答案
按热度按时间zbdgwd5y1#
是不是可以把[] 去掉 后再处理。
nhjlsmyf2#
我已经搞定了,先用正则表达式把"[ []]" 把表情识别出来再添加到自己的词库里面。
iyfjxgzm3#
@Justxu 不行啊,我试着jieba.add_word('[白眼]'),但是结果里还是会把文字和符号拆开