在公共NER demo中,我输入了文本& with"hi with 'my <<10 < 10
来测试XML转义(但它也适用于其他输入)。
结果很奇怪。输出中的<
被正确地转义为<
,但然后<
没有被转义为&lt;
,而是保留为<
:
这看起来像是一个bug。无法判断输出中的<
是否应该被转义为<
,还是保留为<
。
在网络演示中,'
和"
被转义为反引号(?),而通过正常API调用运行时,这些似乎能正确地转义为'
和"
。所以那里没有问题。
我尝试浏览CoreNLP源代码以了解发生了什么,但根据源代码,这种情况不应该发生,所有这些实体都应该以XML转义的形式出现。
你能告诉我实际的代码/逻辑用于XML转义输出吗?特别是对于普通API(非网络演示)版本。谢谢!
1条答案
按热度按时间ax6ht2ek1#
顺便说一下,当我将输出切换到"inlineXML"时,
<
和<
再次正确显示:(尽管这种输出格式可能有完全不同的代码路径)