CoreNLP 核心NLP服务器命名实体识别标注可视化错误

bz4sfanl  于 2个月前  发布在  其他
关注(0)|答案(9)|浏览(45)

在使用CoreNLP服务器时,我遇到了一些奇怪的命名实体行为。我在下面的4个截图中放置了测试。

请注意,我尝试使用3个不同的JRE构建版本,都是8。
首先感谢您的帮助。

k97glaaz

k97glaaz1#

它不是设计成一次只能处理一个单词的。我猜这就是你想要的,尽管有点难以判断,因为你把截图解读交给了我们。

qnakjoqk

qnakjoqk2#

它不是设计成一次处理一个单词的。我猜这就是你想要的,虽然有点难以判断,因为你把截图解读交给了我们。
感谢你的回复。很高兴知道。
不,在我的情况下,即使是整个短语也会报同样的错误,而这正是我想要的。
我只是在这里简化了例子,以便更容易理解哪些词会抛出错误。

示例:"如果我用包含英格兰的这个短语进行解析,它将抛出与Test 3相同的渲染错误"

运行在Windows 10上。我有公司的代理和McAfee,我不知道这是否相关。
如果你需要更多细节,请告诉我。提前感谢任何建议。

cvxl0en2

cvxl0en23#

正如我之前试图指出的,你过于模糊,无法理解你认为的问题是什么。你在运行什么?你期望发生什么?我使用默认设置运行了CoreNLP,它每次都把英国识别为一个国家。

bihw5rsg

bihw5rsg4#

我认为我考虑的问题是清楚的,抱歉。
这是一个可视化错误。也就是说,人们不应该期望看到红色方块作为结果,而是应该看到类似于Test 1和Test 4的渲染效果。除非你告诉我有不同的看法。
然而,这里有一个带有整个短语的屏幕截图,也许它能帮上忙。
如果你愿意告诉我你需要的其他信息,我会尽力把它发给你。

fkaflof6

fkaflof65#

顺便说一下,如果你需要一个证据来证明英格兰的行为有所不同,这里还有一个带有该证据的屏幕截图。感谢你对我的帮助感兴趣!

toe95027

toe950276#

好的,现在我明白了。红方块是问题所在。我无法使用当前的git头部或最近的官方发布来重现这个问题。你是如何运行服务器的?服务器是否有任何可能相关的文本输出?

mlmc2os5

mlmc2os57#

我非常感谢快速的沟通。

我从命令行启动了服务器。请查看以下从那里复制粘贴的内容:


* d:\users\banusor\JavaProjects\stanford-corenlp-4.0.0>java -mx4g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLPServer

[main] INFO CoreNLP - --- StanfordCoreNLPServer#main() called ---
[main] INFO CoreNLP - Warning: cannot find edu/stanford/nlp/models/srparser/englishSR.ser.gz
[main] INFO CoreNLP - Setting default constituency parser to PCFG parser: edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz
[main] INFO CoreNLP - To use shift reduce parser download English models jar from:
[main] INFO CoreNLP - [https://stanfordnlp.github.io/CoreNLP/download.html](https://stanfordnlp.github.io/CoreNLP/download.html) 
[main] INFO CoreNLP - Threads: 8
[main] INFO CoreNLP - Starting server...
[main] INFO CoreNLP - StanfordCoreNLPServer listening at /0:0:0:0:0:0:0:0:9000
[pool-1-thread-1] INFO CoreNLP - [/0:0:0:0:0:0:0:1:50552] API call w/annotators tokenize,ssplit,pos,lemma,ner
With England inside, rendering error.
[pool-1-thread-1] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator tokenize
[pool-1-thread-1] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator ssplit
[pool-1-thread-1] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator pos
[pool-1-thread-1] INFO edu.stanford.nlp.tagger.maxent.MaxentTagger - Loading POS tagger from edu/stanford/nlp/models/pos-tagger/english-left3words-distsim.tagger ... done [0.5 sec].
[pool-1-thread-1] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator lemma
[pool-1-thread-1] INFO edu.stanford.nlp.pipeline.StanfordCoreNLP - Adding annotator ner
[pool-1-thread-1] INFO edu.stanford.nlp.ie.AbstractSequenceClassifier - Loading classifier from edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz ... done [1.6 sec].
[pool-1-thread-1] INFO edu.stanford.nlp.ie.AbstractSequenceClassifier - Loading classifier from edu/stanford/nlp/models/ner/english.muc.7class.distsim.crf.ser.gz ... done [0.4 sec].
[pool-1-thread-1] INFO edu.stanford.nlp.ie.AbstractSequenceClassifier - Loading classifier from edu/stanford/nlp/models/ner/english.conll.4class.distsim.crf.ser.gz ... done [1.5 sec].
[pool-1-thread-1] INFO edu.stanford.nlp.time.JollyDayHolidays - Initializing JollyDayHoliday for SUTime from classpath edu/stanford/nlp/models/sutime/jollyday/Holidays_sutime.xml as sutime.binder.1.
[pool-1-thread-1] INFO edu.stanford.nlp.time.TimeExpressionExtractorImpl - Using following SUTime rules: edu/stanford/nlp/models/sutime/defs.sutime.txt,edu/stanford/nlp/models/sutime/english.sutime.txt,edu/stanford/nlp/models/sutime/english.holidays.sutime.txt
[pool-1-thread-1] INFO edu.stanford.nlp.pipeline.TokensRegexNERAnnotator - ner.fine.regexner: Read 580705 unique entries out of 581864 from edu/stanford/nlp/models/kbp/english/gazetteers/regexner_caseless.tab, 0 TokensRegex patterns.
[pool-1-thread-1] INFO edu.stanford.nlp.pipeline.TokensRegexNERAnnotator - ner
piv4azn7

piv4azn78#

我在Windows和Linux上都运行过这个,使用4.0.0和当前的git头,没有出现这个显示错误。也许是浏览器的问题?你用什么浏览器?我用Chrome测试过这个。

pu82cl6c

pu82cl6c9#

很遗憾,结果相同。Windows 10操作系统,Google Chrome版本76.0.3809.132(官方构建)(64位)。
我刚刚测试了Firefox、IE11和Edge,结果也是一样的......

相关问题