kubernetes 如何调试/列出所有刮入k8s集群的OpenTelemetry目标

jv4diomz  于 2022-11-28  发布在  Kubernetes
关注(0)|答案(1)|浏览(194)

我正在使用以下配置在k8s群集上配置OpenTelemetry

- job_name: MYAPP
  kubernetes_sd_configs:
  - role: pod
  metrics_path: /metrics
  scrape_interval: 10s
  relabel_configs:
  - source_labels: [__meta_kubernetes_namespace]
    action: keep
    regex: (myapp.*|custom.*)
  - source_labels: [__meta_kubernetes_namespace]
    action: replace
    target_label: namespace
  - source_labels: [__meta_kubernetes_pod_name]
    action: replace
    target_label: pod
  - source_labels: [__meta_kubernetes_pod_name, __meta_kubernetes_pod_ip]
    action: replace
    regex: (.*);(.*)
    replacement: $${2}-$${1}
    target_label: instance
  - source_labels: [__meta_kubernetes_pod_container_image]
    action: replace
    target_label: image
  - source_labels: [__meta_kubernetes_pod_container_name]
    action: replace
    target_label: container
  - source_labels: [__meta_kubernetes_pod_ip]
    action: replace
    regex: (.*)
    replacement: $${1}:3000
    target_label: __address__

我的所有微服务都在http://<ip>:3000/metrics应用程序指标上公开。我的集群有8个节点,其中包含100多个微服务。
如何调试/列出OpenTelemetry检测到的所有目标?
我需要它,因为即使所有服务都已启动并运行,我也会随机错过指标,而且似乎kubernetes_sd_configs没有使用某些目标。
那么,如果刮擦工作正常,该如何调试呢?

wrrgggsh

wrrgggsh1#

使用/处理/监视Prometheus中的up度量:

up{job="<job-name>", instance="<instance-id>"}: 1 if the instance is healthy, i.e. reachable, or 0 if the scrape failed.

因此,在您的情况下,它可以是:

up{job="MYAPP"}

相关问题