文章40 | 阅读 31718 | 点赞0
分布式链路追踪系统,链路的追踪大体流程如下:
本文主要分享【第二部分】 SkyWalking Agent 发送 Trace 数据。
考虑到减少外部组件的依赖,Agent 收集到 Trace 数据后,不是写入外部消息队列( 例如,Kafka )或者日志文件,而是 Agent 写入内存消息队列,后台线程【异步】发送给 Collector 。
本文涉及的类非常少,如下图所示:
org.skywalking.apm.agent.core.remote.TraceSegmentServiceClient
,TraceSegment 发送服务客户端。它是一个服务,也是一个客户端,负责将 TraceSegment 异步发送到 Collector 。
我们先来看看 TraceSegmentServiceClient 的属性:
TIMEOUT
静态属性,发送等待超时时长,单位:毫秒。lastLogTime
属性,最后打印日志时间。该属性主要用于开发调试。segmentUplinkedCounter
属性,TraceSegment 发送数量。segmentAbandonedCounter
属性,TraceSegment 被丢弃数量。在 Agent 未连接上 Collector 时,产生的 TraceSegment 将被丢弃。carrier
属性,内存队列。在 《SkyWalking 源码分析 —— DataCarrier 异步处理库》 有对 DataCarrier 的详细解析。serviceStub
属性,非阻塞 Stub 。status
属性,连接状态。下面,我们来介绍 TraceSegmentServiceClient 实现的接口以及对应的方法。
#beforeBoot()
方法,代码如下:
GRPCChannelManager#addChannelListener(this)
方法,将自己添加到 GRPCChannelManager 中,作为一个监听器,从而调用 #statusChanged(GRPCChannelStatus)
方法,实现对连接状态( status
)的监听处理。#boot()
方法,代码如下:
#consume(List<TraceSegment> )
方法,实现异步发送 TraceSegment 到 Collector 。#afterBoot()
方法,代码如下:
TracingContext.ListenerManager#add(this)
方法,将自己添加到 ListenerManager 中,作为一个监听器,从而调用 #afterFinished(TraceSegment)
方法,实现收集到新的 TraceSegment ,添加到内存队列。#shutdown()
方法,代码如下:
DataCarrier#shutdownConsumers()
方法,停止消费。#statusChanged(GRPCChannelStatus)
方法,代码如下:
#afterFinished(TraceSegment)
方法,代码如下:
TraceSegment.ignore = true
时,忽略该 TraceSegment 。#consume(List<TraceSegment>)
方法,代码如下:
—— 连接中 ——
第 119 行:创建 org.skywalking.apm.agent.core.remote。GRPCStreamServiceStatus
对象。
第 122 至 141 行:创建 StreamObserver 对象。在下面,我们可以看到 Agent 发送 TraceSegment 给 Collector 是非阻塞的方式,通过该对象,观察执行结果。
第 130 行 || 第 139 行:当发生错误或者完成时,调用 GRPCStreamServiceStatus#finished()
方法,标记完成。为什么呢?下面会看到。
第 134 行:调用 GRPCChannelManager#reportError(Throwable)
方法,汇报错误。如果是连接错误,GRPCChannelManager 会负责断开重连。
第 144 至 151 行:逐条非阻塞发送 TraceSegment 请求。
第 146 行:调用 TraceSegment#transform()
方法,将 TraceSegment 转换成 org.skywalking.apm.network.proto.UpstreamSegment
对象,用于 gRPC 传输,参见 TraceSegmentService.proto
的数据结构定义。
DistributedTraceId#toUniqueId()
ID#transform()
AbstractTracingSpan#transform()
ExitSpan#transform()
LogDataEntity#transform()
TraceSegmentRef#transform()
KeyValuePair#transform()
第 154 行:调用 StreamObserver#onCompleted()
方法,标记全部请求发送完成。
第 157 至 159 行:调用 GRPCStreamServiceStatus#wait4Finish(maxTimeout)
方法,等待 Collector 处理完成。这就是为什么上面需要调用 GRPCStreamServiceStatus#finished()
方法。完成后,记录数量到 segmentUplinkedCounter
。
注意,此处若等待完成超时,TraceSegment 依然在发送,或者被 Collector 处理中,直到最终的成功或失败。
—— 未连接 ——
第 161 行:记录数量到 segmentAbandonedCounter
。
—— ALL ——
调用 #printUplinkStatus()
方法,每三十秒,打印一次 segmentUplinkedCounter 和 segmentAbandonedCounter 数据。主要用于开发调试。另外,该方法会重置 segmentUplinkedCounter
和 segmentAbandonedCounter
计数。
ps:目前 DataCarrier 最长每 20 秒消费一次。
#onError(List<TraceSegment>, Throwable)
方法,当消费发生异常时,打印日志。
版权说明 : 本文为转载文章, 版权归原作者所有 版权申明
原文链接 : https://blog.csdn.net/weixin_42073629/article/details/119703600
内容来源于网络,如有侵权,请联系作者删除!