java—如何在ApacheStorm中以编程方式重新启动拓扑的worker

b09cbbtk 于 2021-06-24 发布在 Storm

关注(0)|答案(2)|浏览(372)

我在Apache风暴中面临一个问题
问题场景：
当小数据被发送到storm时，数据会被拓扑正确地处理（只有一个工作线程）并进一步释放以在mongodb中持久化。
但当数据量很大时，它会对数据进行处理并保存在数据库中，但以后无论数据量大小都不会接受任何其他数据。
当前解决方法：
我们从storm ui重新启动worker。
问题：
我们能以编程方式重新启动拓扑工作者吗？

Java apache-storm

来源：https://stackoverflow.com/questions/52791515/how-to-restart-worker-for-a-topology-programatically-in-apache-storm

2条答案

按热度按时间

i86rm4rw1#

重启worker从来不是一个好的解决方案，可能会丢失一些元组。最佳实践是利用storm消息可靠性功能，正如rahim所回答的那样。
然而，除了消息可靠性风暴有一个内部背压机制，这意味着当喷口注入的数据超过螺栓能够处理的数据时，喷口将自动减速。
要实现这一点，您首先需要，正如rahim所说，启用acking。这意味着如果您的拓扑结构很简单：
喷口->螺栓
喷口可以：

public void nextTuple(){
  ...
  _collector.emit(new Values(tuple), tupleId);
}

@Override
publci void ack(Object msgId) { super.ack(msgId); }

其中tupleid是一个增量计数器 count++ . 通过这种方式，您可以声明对等待确认的新元组进行风暴处理。
同时，在连续螺栓和拓扑中的所有连续螺栓中，或者至少在导致瓶颈的螺栓之前，您将编写：

public void execute(Tuple tuple){
  ...
  _collector.emit(tuple, new Values(newTuple));
  _collector.ack(tuple);
}

通过这种方式，您将注意到元组已被完全处理。
至少但不是最后，在声明拓扑生成器的main方法中，必须定义喷口将等待的最大元组数：

Config conf = new Config();
conf.setMaxSpoutPending(100);

通过这种方式，喷口将开始生成等待确认的新元组，如果（在本例中）挂起的元组数超过100，喷口将停止调用nexttuple方法，等待它们被确认，然后生成新元组。
n、 b:值100只是一个例子，您可能需要对它进行一些调整，以使其适合您的情况。
rahim共享的链接应该足以理解该机制，无论如何，如果您想深入到实现，我添加以下链接：
http://storm.apache.org/releases/current/acking-framework-implementation.html

赞(0）回复(0）举报 2021-06-24

bprjcwpo2#

storm有两种螺栓类型：irichbolt和ibasicbolt。如果您实现了ibasicbolt，那么您也应该实现acknowledge。此外，您应该发送确认在您的螺栓，以防止锁定。这些链接是好的：
http://storm.apache.org/releases/1.0.6/concepts.htmlhttphttp://storm.apache.org/releases/1.2.2/message-processing.html

赞(0）回复(0）举报 2021-06-24

我来回答

java—如何在ApacheStorm中以编程方式重新启动拓扑的worker

2条答案

相关问题

热门标签

最新问答