CoreNLP 无限递归问题...:(

gkn4icbw  于 6个月前  发布在  其他
关注(0)|答案(3)|浏览(72)

你好,这个问题可能是由于Stanford NLP库的版本不兼容导致的。你可以尝试升级Stanford NLP库到最新版本,或者使用其他类似的库。

f3temu5u

f3temu5u1#

对不起,但这不足以诊断问题。如果您/当您隔离出导致困难的一段文字,甚至是整个文档时,请告知我们,我们会查看....

2023年3月13日星期一下午4点29分,alanlit ***@***.***>写道:运行4.5.2版本和默认的英语模型4.5.2。每隔一段时间,我会出现以下栈爆炸递归:at edu.stanford.nlp.parser.lexparser.TreeBinarizer.outsideBinarizeLocalTree(TreeBinarizer.java:479) at edu.stanford.nlp.parser.lexparser.TreeBinarizer.outsideBinarizeLocalTree(TreeBinarizer.java:479) at edu.stanford.nlp.parser.lexparser.TreeBinarizer.outsideBinarizeLocalTree(TreeBinarizer.java:479) at edu.stanford.nlp.parser.lexparser.TreeBinarizer.outsideBinarizeLocalTree(TreeBinarizer.java:479) at edu.stanford.nlp.parser.lexparser.TreeBinarizer.outsideBinarizeLocalTree(TreeBinarizer.java:479)......

无论是在NER管道上:props.setProperty("annotators", "tokenize,ssplit,pos,lemma,ner") props.setProperty("ner.statisticalOnly", "true") props.setProperty("parse.model", "edu/stanford/nlp/models/srparser/englishSR.ser.gz")还是在情感管道上:props.setProperty("parse.model", "edu/stanford/nlp/models/srparser/englishSR.ser.gz") props.setProperty("annotators", "tokenize,ssplit,pos,parse,sentiment")对不起,我不知道哪个(或者有触发它的文本样本)。正在使用openjdk 17.0.2。有什么想法可能会发生吗?谢谢Alan——直接回复此电子邮件,查看GitHub <#1348>,或取消订阅< https://github.com/notifications/unsubscribe-auth/AA2AYWJ2GAT6G7LEWCEBDYDW36UW3ANCNFSM6AAAAAAVZXBQGU >。您收到此邮件是因为您订阅了此线程。消息ID:***@***.***>

zpgglvta

zpgglvta2#

非常理解 - 问题是它可以在运行一天左右后出现堆栈溢出 - 我仍在尝试隔离一个测试用例,但在此期间,它决定通过另一种途径发生堆栈溢出。不知道这是否能给你一点线索:
ava.lang.StackOverflowError
at org.ejml.simple.AutomaticSimpleMatrixConvert.specify(AutomaticSimpleMatrixConvert.java:46)
at org.ejml.simple.SimpleBase.insertIntoThis(SimpleBase.java:960)
at edu.stanford.nlp.neural.NeuralUtils.concatenateWithBias(NeuralUtils.java:282)
at edu.stanford.nlp.sentiment.SentimentCostAndGradient.forwardPropagateTree(SentimentCostAndGradient.java:543)
at edu.stanford.nlp.sentiment.SentimentCostAndGradient.forwardPropagateTree(SentimentCostAndGradient.java:511)
at edu.stanford.nlp.sentiment.SentimentCostAndGradient.forwardPropagateTree(SentimentCostAndGradient.java:512)
at edu.stanford.nlp.sentiment.SentimentCostAndGradient.forwardPropagateTree(SentimentCostAndGradient.java:512)
at edu.stanford.nlp.sentiment.SentimentCostAndGradient.forwardPropagateTree(SentimentCostAndGradient.java:512)
at edu.stanford.nlp.sentiment.SentimentCostAndGradient.forwardPropagateTree(SentimentCostAndGradient.java:512)
at edu.stanford.nlp.sentiment.SentimentCostAndGradient.forwardPropagateTree(SentimentCostAndGradient.java:512)
at edu.stanford.nlp.sentiment.SentimentCostAndGradient.forwardPropagateTree(SentimentCostAndGradient.java:512)
at edu.stanford.nlp.sentiment.SentimentCostAndGradient.forwardPropagateTree(SentimentCostAndGradient.java:512)
.........等等。

h43kikqp

h43kikqp3#

这确实看起来像是一个具有非常深解析树的问题,无论是因为解析退化还是因为文本非常长导致了一个巨大的解析树。你是否给它提供了任何不切实际的长文本?

相关问题