我基本上有一个完整的文档,在某个点上包含text=“r e s u l t”,在我标记它之后,函数会一个字母一个字母地标记它,所以我想让计算机知道“result”必须标记为一个完整的单词。关于如何消除文档中由空格分隔的单词的空格,有什么想法吗?
我在想,如何让计算机知道,如果它发现一个像字母+空格+字母+空格这样的模式,也许它可以识别它?
这是我得到的输出:
名词连词
名词obj
s propn obj
u形支撑板
拉平
t形支撑板
这是我的代码:
for value in dict.values():
sentence= nlp2(value)
for token in sentence:
token_text = token.text
token_pos = token.pos_
token_dep = token.dep_
print("{:<12}{:<10}{:<10}".format(token_text,token_pos,token_dep))
非常感谢!:)
1条答案
按热度按时间6tqwzwtp1#
看起来句子的变量是“result”这个词,所以您要遍历这些字母。例如,如果句子是一个列表,您将遍历单词。所以,检查你的值和句子变量,看看你需要调整什么。请参见此玩具示例: